TAMO.seq.GenerateFastas
index
/home/David_Gordon/docs/TAMO/seq/GenerateFastas.py

#Copyright (2005) Whitehead Institute for Biomedical Research (except as noted below)
#All Rights Reserved
#
#Author: David Benjamin Gordon

 
Modules
       
TAMO.HT
TAMO.MotifMetrics
TAMO.MotifTools
getopt
math
os
re
sys

 
Classes
       
SimilarFilter

 
class SimilarFilter
    Class to use data about similarity between sequences (e.g. predicted PCR
products on microarrays) to reduce a list of probes to a quasi-unique set.
Not used in the release version of TAMO.
 
  Methods defined here:
__init__(self, pcnt=70)
filter(self, probelist_orig)
Port of removeduplicates.pl
Behavior is only almost identical.  The inconsistencies occur in the
unusual case that A~B, and B~C but A !~ C.  In the perl code B and C
would be preserved, but in this code, only C is, due to differences 
in sorting order different list order on input. At 70% id, here
are some sample differences:
 
GAL4 Cu2.fsa:55            | GAL4 Cu2.fsa:54
MCM1 YPD.fsa:110           | MCM1 YPD.fsa:109
RDS1 H2O2.fsa:64           | RDS1 H2O2.fsa:63
RLM1 YPD.fsa:65            | RLM1 YPD.fsa:64
ZAP1 Zn.fsa:43             | ZAP1 Zn.fsa:42
loadsimilarfile(self)

 
Functions
       
getarg(varname)
main()
parse_opts()
usage(txt='')

 
Data
        BADPROBES = []
GLOBALS = {}