Universitat Internacional de Catalunya

Bioinformática Estructural

Bioinformática Estructural
3
14864
4
Primer semestre
op
Lengua de impartición principal: inglés

Otras lenguas de impartición: catalán, castellano

Profesorado


Las dudas serán resueltas antes o después de clase. Para resolver dudas no presenciales, se harán mediante videoconferencia.


Presentación

En esta asignatura se proporcionan los conceptos fundamentales para el uso de la información estructural en problemas biomédicos/clínicos. Para ello se abordará la relación fundamental entre estructura y función, analizando las estructuras tridimensionales de proteínas, ADN y ARN. Veremos cómo procesar gráfica y automáticamente las estructuras tridimensionales de las macromoléculas. Posteriormente veremos las diferentes metodologías para generar información estructural mediante metodologías punteras que incluyen algoritmos de Inteligencia Artificial. Finalmente veremos cómo podemos utilizar la bioinformática estructural para abordar problemas biomédicos relacionados con la comprensión molecular de las enfermedades hereditarias.


Requisitos previos

Se recomienda haber cursado y superado: 

  • Introducción a la bioinformática 

  • Interacciones biomoleculares

Objetivos

  • Comprender cómo la relación entre estructura y función es la base de la aplicación de los métodos de bioinformática estructural en biomedicina

  • Saber generar información estructural: diferencia entre extracción y predicción 

  • Utilizar la información estructural para analizar la información genética y resolver problemas biomédicos/clínicos asociados

Competencias/Resultados de aprendizaje de la titulación

CB3 Que los estudiantes tengan la capacidad de reunir e interpretar datos relevantes (normalmente dentro de su área de estudio) para emitir juicios que incluyan una reflexión sobre temas relevantes de índole social, científica o ética

CG7Integrar los conceptos básicos relacionados con el campo de la biomedicina tanto a nivel teórico como experimental.

CG10Diseñar, redactar y ejecutar proyectos relacionados con el área de las Ciencias Biomédicas

CG11Reconocer conceptos básicos de diferentes ámbitos vinculados a las ciencias biomédicas.

CT5Usar internet como medio de comunicación y como fuente de información.

CT6Saber comunicar, hacer presentaciones y redactar trabajos científicos.

CT7Ser capaz de trabajar en equipo.


Resultados de aprendizaje de la asignatura

Como resultado de aprendizaje específico de esta mención se contemplan el siguiente:

- Aprender a analizar los problemas biomédicos y a identificar los aspectos que requieren el uso de información estructural. Aprender a obtener la información estructural de interés aplicando las técnicas del ámbito de la bioinformática estructural, tales como la extracción de información estructural, el modelado/predicción molecular, el manejo de bases de datos/generación de big data, etc. Aplicar el conocimiento a la comprensión de la base molecular de las enfermedades hereditarias y a la predicción de la patogenicidad de las variantes genéticas.


Contenidos

Bioinformatics as a tool for managing heterogeneous information, extracting knowledge about clinical/biomedical problems, from image diagnosis to identifying pathogenic genetic variants. In Struc. Bioinf. we focus on those problems happening at the molecular level. Most of them are related with the molecular view of disease, especially genetic disease. Examples: pathogenic variants in coding and non-coding sequence. These variants cause molecular malfunction; to understand this malfunction we need to understand function first and this means looking at structure. It is important to note that the information we have about structure will determine what we know about function. That is: quality determines usefulness. 

Relevant questions: (i) how to determine which information level we want; (ii) how do we extract 3D info; (iii) how to conclude from what we have? (seeking consistency between different sources of evidence), particularly in the context of biomedical applications.  


A. STRUCTURE: THE LOCUS OF FUNCTION 

1) PRINCIPLES OF STRUCTURAL BIOLOGY

1.1 Function at the sequence level. 

  • CLASE MAGISTRAL.

    • Domains, disordered regions, repetitive regions. 

    • Value and limitations. It is useful for a first assessment of the impact of protein variants; inadequate for deeper understanding. Not of value for drug design, nor for a mechanistic interpretation of disease


  • MÉTODOS DEL CASO.

    • UniProt: the most important resource for general information on proteins. 

    • Specific resources for functional domains, disordered, and repetitive regions. PFAM and SMART. 


1.2 The structure of macromolecules

  • CLASE MAGISTRAL. 

    • What do we mean by structure? Examples of 3D for different macromolecules, e.g., protein, RNA, DNA, and chromatin structure.

    • Key relevant aspects of function that depend on structure: stability and interactions (the role of environment)


1.3 Relating structure to function. 

  • CLASE MAGISTRAL. 

  • The broad spectrum of protein function. Antibody, hemoglobin, a-galactosidase, BRCA1, etc. Moonlighting proteins.

  • DNA: the structure of the genetic code

  • Chromatin: packing is the key to compaction. But it also requires unpacking. 


  • MÉTODOS DEL CASO.

    • PDB: The experimental understanding of structure and the storage databases. PDB. EMDB. 


1.4 What parts of structure are relevant for function? It depends on the protein. How does bioinformatics allow us to know them? 

  • CLASE MAGISTRAL. 

  • Understanding structure I. (i) The hierarchy of protein structure: 1D, 2D, 3D, and quaternary. (ii) Core/Surface. (iii) The need to have a 3D structure in many problems.

  • Understanding structure II. (i) The network of atomic interactions. Not all interactions are the same (ii) The energetics of 3D structures. Protein stability predictions (iii) Protein-complexes.

  • Understanding structure III. Disordered proteins/regions. Resources


B. USING BIOINFORMATICS TO GENERATE STRUCTURAL INFORMATION

2) EXTRACTING INFORMATION FROM STRUCTURE: VISUAL EXPLORATION AND COMPUTATIONAL ANALYSES. 

  • CLASE MAGISTRAL. 

    • How to retrieve experimental structural information: (i) protein/gene name (uniprot); (ii) blast sequence

    • Possible situations: is structure always available?

    • Choose your visualization software: PyMol / VMD

    • What to look at? The different representations we can choose: Calpha, main chain, all atoms, focus on local regions. 

    • Clarifying your goal: understanding the contribution of a residue to the stability or its interaction with other molecules, define the amount of work

    • Tools: Arpeggio, String. 

    • Be careful with what you analyze: some structures are not meaningful biologically, e.g. crystal contacts, etc. Working with the monomer is the safest option, reading the original papers is the next step, checking specialized websites like Eldorado (for NMR) or biological complexes at the EBI.


  • MÉTODOS DEL CASO: 

    • PYMOL: Representing protein sequence variants


3) GENERATING STRUCTURAL INFORMATION: STRUCTURE PREDICTION

3.1 From sequence to structure: a key problem. 

  • CLASE MAGISTRAL. 

    • How sequence determines 3D. Why prediction is such a difficult problem?

    • Alternatives: the most fundamental relationship in molecular biology: conservation vs structure/stability 

    • Another fundamental principle: the conservation of structure beyond sequence identity


  • MÉTODOS DEL CASO: 

    • Homology. Sequence alignment and comparison. 

    • Building and understanding MSA: generalizing sequence comparison to many sequences. A difficult problem: NP-complete. Main tools: clustal, T-Coffee, Muscle, etc. Representing and editing MSA. 


  • MÉTODOS DEL CASO: 

    • Structure comparison. Going beyond sequence similarity: Aligning different versions of the same structure. Finding how similar are different structures. Structure comparison: DALI. Structure classification: CATH, SCOP.


3.2 Homology/comparative modeling. 

  • CLASE MAGISTRAL.. 

  • Predicting the structure of close homologs

    • The comparative modeling pipeline

    • Quality checks: PROSA, program listings, etc

    • Online modeling: SwissProt

  • Predicting the structure of remote homologs/paralogs: threading

    • The fold space

    • Threading: principles and tools.



  • CLASE MAGISTRAL. 

    • Ab initio structure prediction. AlphaFold: the new paradigm. 


3.3. Disorder predictions. 

  • CLASE MAGISTRAL. 

    • Disordered state

    • Predicting disorder


C) APPLYING STRUCTURAL BIOINFORMATICS IN BIOMEDICINE

8) APPLYING MACHINE LEARNING TO UNDERSTAND DISEASE

  • CLASE MAGISTRAL. 

  • A mild introduction to artificial intelligence and machine learning. 


  • MÉTODOS DEL CASO. 

  • Building a machine learning model: four main steps

  • Retrieving protein sequence variants. Clinvar. HGMD. Mapping variants to our protein: what information do we need to know. 

  • Generating pathogenicity predictions for our variants. Polyphen-2, SIFT, PON-P2, CADD, REVEL, EVE, etc. 

  • Predicting functional impact vs. clinical phenotype.



Clases magistrales: 15 horas 

Métodos del Caso: 15 horas

Prácticas: 0 horas 


Metodología y actividades formativas

Modalidad totalmente presencial en el aula



Clases magistrales: exposición durante 50 minutos de un tema teórico por parte del profesor.

Casos clínicos o métodos del caso (MC): Planteamiento de una situación real o imaginaria. Los alumnos trabajan las preguntas formuladas en grupos reducidos o en interacción activa con el profesor y se discuten las respuestas. El profesor interviene activamente y si hace falta aporta nuevos conocimientos.

Educación virtual (EV): Material online que el alumno puede consultar desde cualquier ordenador, a cualquier hora y que contribuirá al autoaprendizaje de conceptos relacionados con la asignatura.


Sistemas y criterios de evaluación

Modalidad totalmente presencial en el aula



  1. Alumnos en primera convocatoria:   

Resolución de métodos del caso: 35%

Examen final: 50%

Presentación de un artículo científico: 15%

Alumnos en segunda o posterior convocatoria: mismos criterios que en la primera convocatoria. La nota de evaluación continuada y participación se guardará. 

Puntos generales a tener en cuenta sobre el sistema de evaluación:  

  1. Para poder hacer media, en el examen final se deberá obtener un 5 de nota mínima.

  2. La asistencia a métodos del caso es obligatoria.

  3. Por participación en clase se entiende la aportación de ideas interesantes o el planteamiento de cuestiones pertinentes que ayuden a mejorar la calidad de la sesión, ya sea lección magistral o métodos del caso.

  4. La asistencia a las clases teóricas no es obligatoria, pero los asistentes se tendrán que regir por las normas que indiquen los profesores. En caso de no llegar puntual, entrar en silencio sin molestar o interrumpir a la clase. En caso de no asistir un mínimo del 65%, la participación en clase será puntuada de forma muy reducida.

Bibliografía y recursos

Kessel, A., & Ben-Tal, N. (2018). Introduction to proteins: structure, function, and motion. Chapman and Hall/CRC.

Xiong, J. (2006). Essential bioinformatics. Cambridge University Press

Creighton, Thomas E. The biophysical chemistry of nucleic acids & proteins. Helvetian Press, 2010 

PETER ALAN & Tompa FERSHT Structure and function of intrinsically disordered proteins / by Peter Tompa, Fersht Alan Publications. 2010


Periodo de evaluación

E: fecha de examen | R: fecha de revisión | 1: primera convocatoria | 2: segunda convocatoria:
  • E1 11/01/2024 I3 14:00h
  • R1 23/01/2024 A10 18:00h