teaching:progappchim:bioinformatic

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
teaching:progappchim:bioinformatic [2016/03/15 13:29]
villersd
teaching:progappchim:bioinformatic [2021/03/03 10:27] (Version actuelle)
villersd [Installer Biopython]
Ligne 1: Ligne 1:
 ====== Bioinformatique ====== ====== Bioinformatique ======
-Manipulations de séquences ADN, ARN, protéines,...+Un des objectifs majeurs de la [[wp>fr:Bio-informatique|bioinformatique]] réside dans l'étude automatique de séquences, principalement de l'ADN et de protéines,... 
 + 
 +Ces séquences sont accessibles librement et publiquement, notamment par ces deux sources : 
 + 
 +{{wp>fr:UniProt}} 
 + 
 +Voir aussi le site [[https://www.uniprot.org/]] 
 + 
 +{{wp>fr:GenBank}} 
 + 
 +Voir aussi le site [[https://www.ncbi.nlm.nih.gov/genbank/]] 
 + 
 +===== Installer Biopython ===== 
 + 
 +[[https://biopython.org/|Biopython]] est une librairie de programmes en langage Python dédiée à l'étude de séquences (ADN, ARN, protéines)Pour utiliser cette librairie, elle doit-être installée au préalable, par exemple : 
 +  * Avec la distribution Anaconda, via l'interface Anaconda-Navigator, au départ du canal "conda-forge' ou par la commande suivante : conda install -c conda-forge biopython 
 +  * via le site Pypi (pypi.org) et la commande suivante : pip install biopython 
  
-FIXME : à compléter (différents formats, bases de données ?) 
  
 ===== Compter les nucléotides d'une séquence ADN ===== ===== Compter les nucléotides d'une séquence ADN =====
  
-<sxh python; title : Counting_DNA_Nucleotides-01.py>+<code python Counting_DNA_Nucleotides-01.py>
 #!/usr/bin/env python #!/usr/bin/env python
 # -*- coding: utf-8 -*- # -*- coding: utf-8 -*-
Ligne 16: Ligne 32:
  
 # utilisation d'une liste et de la méthode .count() # utilisation d'une liste et de la méthode .count()
-bases=["A","C","G","T"]+bases = ["A","C","G","T"]
 for base in bases: for base in bases:
-    print adn.count(base), +    print(adn.count(base),) 
-print+print()
  
 # Variante : # Variante :
 for c in 'ACGT': for c in 'ACGT':
-    print adn.count(c), +    print(adn.count(c),) 
-print+print()
  
 # variante un peu moins lisible # variante un peu moins lisible
Ligne 33: Ligne 49:
  
 # utilisation de la technique "list comprehension" # utilisation de la technique "list comprehension"
-count=[adn.count(c) for c in 'ACGT']+count = [adn.count(c) for c in 'ACGT']
 for val in count: for val in count:
-    print val, +    print(val,) 
-print+print()
  
 # autre "list comprehension", avec impression formatée → version "one line" # autre "list comprehension", avec impression formatée → version "one line"
-print "%d %d %d %d" % tuple([adn.count(X) for X in "ACGT"])+print("%d %d %d %d" % tuple([adn.count(X) for X in "ACGT"]))
  
 # count "à la main", sans utilisation de fonctions/librairie # count "à la main", sans utilisation de fonctions/librairie
Ligne 49: Ligne 65:
             count[i] +=1             count[i] +=1
 for val in count: for val in count:
-    print val, +    print(val,) 
-print+print()
  
 # count "à la main", avec .index() # count "à la main", avec .index()
Ligne 58: Ligne 74:
     count[ACGT.index(c)] += 1     count[ACGT.index(c)] += 1
 for val in count: for val in count:
-    print val, +    print(val,) 
-print+print()
  
 # utilisation de la librairie collections # utilisation de la librairie collections
Ligne 66: Ligne 82:
 for c in adn: for c in adn:
     ncount[c] += 1     ncount[c] += 1
-print ncount['A'], ncount['C'], ncount['G'], ncount['T']+print(ncount['A'], ncount['C'], ncount['G'], ncount['T'])
  
 # collections.Counter # collections.Counter
 from collections import Counter from collections import Counter
-for k,v in sorted(Counter(adn).items()): print v, +for k,v in sorted(Counter(adn).items()): 
-print+    print(v,) 
 +print()
  
 # avec un dictionnaire # avec un dictionnaire
Ligne 77: Ligne 94:
 for c in adn: for c in adn:
     freq[c] += 1     freq[c] += 1
-print freq['A'], freq['C'], freq['G'], freq['T']+print(freq['A'], freq['C'], freq['G'], freq['T'])
  
 # avec un dictionnaire et count(), impression différente # avec un dictionnaire et count(), impression différente
 dico={} dico={}
 for base in bases: for base in bases:
-    dico[base]=adn.count(base)+    dico[base] = adn.count(base)
 for key,val in dico.items(): for key,val in dico.items():
-    print "{} = {}".format(key, val) +    print("{} = {}".format(key, val)
-</sxh>+</code>
  
  
Ligne 91: Ligne 108:
 + lecture de fichier + lecture de fichier
  
-<sxh python; title : Finding_a_Protein_Motif-01.py>+<code python Finding_a_Protein_Motif-01.py>
 #!/usr/bin/env python #!/usr/bin/env python
 # -*- coding: utf-8 -*- # -*- coding: utf-8 -*-
Ligne 123: Ligne 140:
     "GGU":"G", "GGC":"G", "GGA":"G", "GGG":"G",}     "GGU":"G", "GGC":"G", "GGA":"G", "GGG":"G",}
  
-aminoacids = ''.join(sorted(list(set([v for k,v in dic.items() if v <> "STOP"])))) +aminoacids = ''.join(sorted(list(set([v for k,v in dic.items() if v != "STOP"])))) 
-print aminoacids+print(aminoacids)
  
 # UniProt Protein Database access IDs # UniProt Protein Database access IDs
Ligne 132: Ligne 149:
 seq_record = SeqIO.read(handle, "swiss") seq_record = SeqIO.read(handle, "swiss")
 handle.close() handle.close()
-print +print() 
-print seq_record+print(seq_record)
  
-</sxh>+</code>
  
 ===== Références ===== ===== Références =====
-  * [[http://www.scienceinschool.org/2014/issue29/online_bioinf|Using biological databases to teach evolution and biochemistry]] +  * [[http://biopython.org/wiki/Main_Page|Biopython]] (librairie python de bioinformatique)
-  * [[http://rosalind.info/|Rosalind]], plateforme d'apprentissage de la programmation en bioinformatique +
-  * [[http://www.ncbi.nlm.nih.gov/genbank/|GenBank]] +
-  * [[http://biopython.org/wiki/Main_Page|Biopython]]+
   * [[https://en.wikipedia.org/wiki/Bioinformatics]]   * [[https://en.wikipedia.org/wiki/Bioinformatics]]
   * [[https://en.wikipedia.org/wiki/Open_Bioinformatics_Foundation]]   * [[https://en.wikipedia.org/wiki/Open_Bioinformatics_Foundation]]
   * [[https://en.wikipedia.org/wiki/FASTA_format]]   * [[https://en.wikipedia.org/wiki/FASTA_format]]
   * [[https://en.wikipedia.org/wiki/List_of_open-source_bioinformatics_software]]   * [[https://en.wikipedia.org/wiki/List_of_open-source_bioinformatics_software]]
-  * [[http://www.amberbiology.com/]], "Python For The Life SciencesA gentle introduction to Python for life scientists(à paraître)+  * cours introductif sur biopython : 
 +    * [[https://www.bits.vib.be/component/content/article?id=176:biopython|Introduction to Biopython]] VIB bioinformatics core, Kristian Rother, en particulier [[https://data.bits.vib.be/pub/trainingen/Biopython/Basics_of_Biopython_1.1.pdf|ce tutoriel]] 
 +  * [[https://www.bioinformaticsalgorithms.org/|Bioinformatics Algorithms]] 
 +  * Articles de la revue "Science in School"
 +    * [[https://www.scienceinschool.org/2010/issue17/bioinformatics|Bioinformatics with pen and paper: building a phylogenetic tree]] Cleopatra Kozlowski, 07/12/2010 
 +    * [[https://www.scienceinschool.org/2014/issue29/online_bioinf|Using biological databases to teach evolution and biochemistry]], Germán Tenorio, 02/06/2014 
 +  * documentation sur les arbres phylogénétiques : [[https://biopython.org/wiki/Phylo]] 
 +  * [[http://rosalind.info/|Rosalind]], plateforme d'apprentissage de la programmation en bioinformatique 
 +    * [[http://rosalind.info/glossary/|Glossaire de bioinformatique]] 
 +  * [[https://stepik.org/catalog?language=en&q=bioinformatics|Catalog – Stepik]] cours et challenges en programmation, avec des activités en bioinformatique 
 +    * [[https://stepik.org/course/2/promo|Bioinformatics Algorithms – Stepik]] (cours introductif) 
 +    * [[https://stepik.org/org/bioinf|Bioinformatics Institute – Stepik]] ("institut virtuel" russe sur l'apprentissage de la bioinformatique) 
 +    * [[https://stepik.org/course/945|Bioinformatics Contest 2017 – Stepik]] concours de programmation 2017 
 +    * [[https://stepik.org/course/4377/promo|Bioinformatics Contest 2018 – Stepik]] concours de programmation 2018 
 +    * [[https://stepik.org/course/43615/promo|Bioinformatics Contest 2019 – Stepik]]  concours de programmation 2019 
 +  * [[http://www.amberbiology.com/]] & [[https://pythonforthelifesciences.com/|Python for the Life Sciences – A gentle introduction to Python for life scientists]] programmation privilégiant les modules standards de Python (pas le module biopython par exemple) 
 +  * [[https://www.packtpub.com/eu/application-development/bioinformatics-python-cookbook|Bioinformatics with Python Cookbook]] livre utilisant beaucoup la librairie biopython 
 +  * [[http://www.ncbi.nlm.nih.gov/genbank/|GenBank]]
   * références sur la lecture de fichiers :   * références sur la lecture de fichiers :
     * [[http://www.uniprot.org/help/programmatic_access#id_mapping_python_example]]     * [[http://www.uniprot.org/help/programmatic_access#id_mapping_python_example]]
     * [[http://www.python-simple.com/python-biopython/Lecture-ecriture-sequences.php]]     * [[http://www.python-simple.com/python-biopython/Lecture-ecriture-sequences.php]]
 +  * données exemples dans le cadre de la COVID-19 :
 +    * [[https://www.uniprot.org/uniprot/P0DTC2|S - Spike glycoprotein precursor - Severe acute respiratory syndrome coronavirus 2 (2019-nCoV) - S gene & protein]]
 +
  
  • teaching/progappchim/bioinformatic.1458044954.txt.gz
  • Dernière modification: 2016/03/15 13:29
  • de villersd