Tài liệu Tin sinh học đại cương

pdf 54 trang vanle 4450
Bạn đang xem 20 trang mẫu của tài liệu "Tài liệu Tin sinh học đại cương", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdftai_lieu_tin_sinh_hoc_dai_cuong.pdf

Nội dung text: Tài liệu Tin sinh học đại cương

  1. MỤC TIÊU MÔN HỌC • Về kiến thức: trang bị kiến thức tin học ứng dụng trong công nghệ sinh học như: TIN SINH HỌC ĐẠI CƯƠNG – cơ sở dữ liệu (CSDL) sinh học (Introduction to Bioinformatics) phân tử, – phương pháp phân tích các trình tự sinh học bằng các thuật toán tin học. – một số hướng nghiên cứu mới PGS.TS. Trần Văn Lăng của thế giới liên quan đến tin Email: langtv@vast.vn sinh học. Assoc. Prof. Tran Van Lang, PhD, Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 2 VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY • Về kỹ năng (thông qua giờ thực hành): Sử • Định hướng nghề nghiệp: Giải quyết những dụng được một số phần mềm thông dụng vấn đề cơ sở của sinh học phân tử đặt ra trong việc: cho: – so sánh các trình tự, – công nghệ sinh học, – phân tích trình tự, – y học, – cây phát sinh loài, – dược liệu học – truy cập đến các CSDL sinh học lớn để tìm kiếm sự tương đồng giữa các trình tự sinh học Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 3 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 4 1
  2. NỘI DUNG • Những khái niệm cơ bản • Phương pháp gióng hàng (bắt cặp) hai và về tin sinh học nhiều trình tự sinh học, • Cách thức khai thác một số • Phương pháp BLAST trong việc tìm kiếm sự ngân hàng dữ liệu lớn về tương đồng các trình tự sinh học từ các ngân trình tự sinh học như NCBI, hàng trình tự. EMBL, DDJB, PDB Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 5 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 6 TÀI LIỆU HỌC TẬP • Cách thức sử dụng một số phần mềm thông dụng đề thiết • Trần Linh Thước, et al, kế mồi, lập bản đồ enzyme, về Thực tập Bioinformatics, cây phát sinh loài tài liệu lưu hành nội bộ • Một số hướng nghiên cứu mới của Khoa Sinh học, trong lĩnh vực tin sinh học Trường ĐHKHTH, 2012. đang được thế giới quan tâm. Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 7 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 8 2
  3. TÀI LIỆU ĐỌC THÊM TÀI LIỆU ĐỌC THÊM • Trần Văn Lăng, Ứng dụng Tin học trong việc • Nguyễn Văn Cách, Tin – giải quyết một số bài Sinh học, Nxb. Khoa học toán của Sinh học phân Kỹ thuật, 2008, 144tr tử. Nxb. Giáo dục, (eBook) 2008, 230tr. Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 9 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 10 TÀI LIỆU HỌC TẬP TÀI LIỆU THAM KHẢO • Robert John, Introduction to Bioinformatics • Trần Nhân Dũng, Nguyễn Vũ Linh, Giáo trình Tin /11/bioinformatics.html, 2004. sinh học, Nxb. Đại học • Arthur M. Lesk, Introduction to Cần Thơ, 2011, 168tr. Bioinformatics, Oxford University Express, 2002 (eBook) Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 11 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 12 3
  4. PHẦN MỀM HỖ TRỢ • Blast: • A.D. Baxevanis, B.F F. Ouellette, Bioinformatics: A practical guide to the analysis of genes and proteins, Third Edition, 2005, • Cynthia Gibas, Per Jabeck, Developing Bioinformatics Computer Skills. O’Reilly & Associates, Inc., USA, 2001, Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 13 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 14 Tương tự Clsutal • • Protein alignments: Clustal Omega • DNA alignments: MUSCLE or MAFFT Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 15 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 16 4
  5. Bắt cặp đa trình tự TreeView • • Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 17 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 18 AnnHyb BioEdit • • Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 19 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 20 5
  6. Chương 1: GIỚI THIỆU VỀ TIN SINH HỌC Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 21 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 22 Who am I ? NỘI DUNG • Assoc. Prof. Tran Van Lang, PhD. • Born: 18 Dec 1959, Quang Tri, Vietnam • Residence: Saigon, Vietnam • Nationality: Vietnam • Fields: Computer Science • Lịch sử – High Performance Parallel and Distributed Computing • Định nghĩa – Bioinformatics – Scientific Computation Methods • Sự cần thiết • Institutions: Vietnam Academy of Science and Technology • Một số khái niệm cơ bản • Alma mater: – HCM University of Natural Science (1977) – Dorodnitsyn Computing Center (1991) • And: I have two daughters Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 23 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 24 6
  7. 1.1 Lịch sử • Một trong những nền tảng cơ bản của sinh học đó là tế bào (cell). • Tất cả vật thể sống (living • DNA chứa các gene mã hóa RNA mà nó sẽ thing), bao gồm con người, sinh ra các protein, để từ đó điều chỉnh tất cả đều được tạo thành từ tế các quá trình phát triển của một sinh vật. bào. • Chẳng hạn, với con người có khoảng 100 ngàn tỷ = 1014 tế bào (100 trilion cells). Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 25 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 26 • Bên trong mỗi tế bào có nhân (nucleus) để • Chẳng hạn, mỗi tế bào lưu trữ tất cả các chỉ thị di truyền (genetic người có 46 nhiễm sắc instruction) hay thông tin di truyền (genetic thể, được tổ chức thành 23 information) - ngoại trừ hồng huyết cầu cặp. trưởng thành (mature red blood cell). • Mỗi nhiễm sắc thể được • Những chỉ thị này là chức cấu thành bởi một phân tử năng của tế bào, và cũng để DNA dài (gọi là một trình phân biệt cá thể này với cá tự DNA) thể khác. Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 27 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 28 7
  8. • Những trình tự DNA này cấu tạo bởi các base A, C, G, và T. • Có khoảng 3 tỷ cặp base cho một phân tử • Những base này bắt cặp và xếp chồng với DNA. nhau tạo thành một dạng thang xoắn gấp • Một gene là một đoạn của DNA với trình tự (twisted ladder) hay một dạng xoắn kép base đặc trưng – cụ thể, gọi là mã di truyền (double helix) (genetic code) để xác định chức năng của tế bào (hay là physical trait – nét vật chất) • Mỗi nhiễm sắc thể có khoảng 30.000 gene Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 29 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 30 • Số lượng gene quá lớn, trong • Như vậy, khi đó sự hiểu biết của con – Mỗi tế báo có nhiều nhiễm sắc thể, mỗi nhiễm người về trình tự gene mã hóa sắc thể là một trình tự DNA thành một protein cụ thể lại – Những mã di truyền nằm trong trình tự DNA này quá cơ bản. Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 31 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 32 8
  9. Ngoài ra, • Chẳng hạn, chúng ta thiếu thông tin cần thiết để hiểu một cách đầy đủ • Sự đột biến (mutation) là sự thay đổi một hay – về vai trò của DNA trong rất nhiều căn bệnh nhiều base trong phân tử DNA. – chức năng của những protein được sản sinh ra. • Điều này có thể dẫn đến sự biến đổi đặc trưng (trait) hoặc dẫn đến bệnh di truyền – Chẳng hạn, màu mắt Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 33 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 34 • Sự đột biến có thể được chuyển xuống các • Nó sẽ mang nhiễm sắc thể có đột biến này thế hệ sau từ cha mẹ. lắm ghép với nhiễm sắc thể số 7 bình thường • Chẳng hạn, có đột biến ở nhiễm sắc thể số 7 của tế bào trứng. trong tế bào tinh trùng. • Từ đó tạo ra một tế bào mới, gọi là hợp tử (zygote), rồi phát triển thành phôi (embryo), mà trong đó có đột biến ở nhiễm sắc thể số 7. Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 35 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 36 9
  10. Kết luận Bioinformatics • Sự sống đang tồn tại vô cùng phong phú và • Một ngành mới ra đời để đa dạng tìm mối tương quan của • Mà hiểu biết của con người quá ít ỏi. một lượng khổng lồ thông tin phức tạp được nhóm lại • Từ đó cần: các phương pháp để tập hợp, lưu trong một ngành gọi là trữ, khôi phục, phân tích BIOINFORMATICS (Tin sinh học hay Sinh tin học) Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 37 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 38 Chức năng chính của tin sinh học • Xây dựng các ngân hàng dữ liệu để lưu trữ • Mục đích của nó là cung cấp cho những nhà và quản lý dữ liệu sinh học phân tử khoa học cách thức lý giải: • Tìm ra các phương pháp để xác định mối – sự tiến triển sinh học bình thường quan hệ về mặt sinh học giữa các dữ liệu. – trục trặc trong quá trình phát triển này dẫn đến bệnh tật • Xây dựng các công cụ để phân tích từ đó có – cách thức tiếp cận để cải thiện, điều trị những hiểu biết rõ hơn về nguồn dữ liệu sinh học. Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 39 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 40 10
  11. • 1869: Friedrich Meischer, người Thụy Sĩ khám phá ra trong nhân tế bào chất có tính acid, Ông ta gọi đò là Nuclein hay Nucleic LỊCH SỬ PHÁT TRIỂN TIN SINH HỌC acid Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 41 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 42 • 1891: Albrecht Kossel, người Đức đã thủy phân • 1915: Hai cha con và xác định Nucleic acid nghiên cứu về tinh thể có đường, phosphate và học, cùng nhận giải 4 base hữu cơ, và có 2 Nobel Vật Lý 1915. loại là DNA và RNA • Họ có đóng góp trong • Nhận giải Nobel Sinh lý việc tạo ra X-rays năm 1910 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 43 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 44 11
  12. (Nguồn: • 1930: Arne Wilhelm Kaurin Tiselius (Stockholm) sử dụng kỹ thuật điện di (electrophoresis) để đưa ra giải pháp phân tách protein trong luận án tiến sĩ "The moving-boundary method of studying the • Nhận giải Nobel electrophoresis of proteins" (published in về hóa học 1948 Nova Acta Regiae Societatis Scientiarum Upsaliensis, Ser. IV, Vol. 7, No. 4) Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 45 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 46 • 1951: Linus Carl Pauling và Robert Brainard Corey (US) đề nghị cấu trúc cho xoắn alpha (alpha-helix) và dãi beta (beta- sheet) trong Proc. Natl. Acad. Sci. USA, 27: 205-211, 1951 và Proc. Natl. Acad. Sci. USA, 37: 729-740, 1951. • Từ đó có “Pauling-Corey structure of DNA” Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 47 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 48 12
  13. • 1952: Alexander R. Todd, nhà nghiên cứu sinh hóa người Scotland, tìm ra cấu trúc của đơn vị thành phần Nucleotide của Nucleic acid. • 1953: James Dewey Watson (US) và Francis • Nhận giải Nobel Hóa học Harry Compton Crick (UK) đề nghị mô hình 1957 xoắn kép của DNA Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 49 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 50 • Mô hình này có được • Watson, Crick, trên cơ sở hình chụp Wilkins nhận giải x-ray của DNA được Nobel Sinh lý nhận bởi Rosalind học năm 1962 Franklin và Maurice Wilkins (Nature, 171: 737-738, 1953). Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 51 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 52 13
  14. • 1954: Perutz's group phát triển phương pháp nguyên tử nặng (heavy atom) để giải quyết • 1955: Frederick Sanger (UK) thông báo trình vấn đề nhiều giai đoạn trong việc mô tả hình tự protein đầu tiên được phân tích - bovine thể protein. insulin. • Nhận giải Nobel hóa học 1958, 1980 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 53 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 54 • 1958: (Tin học) Mạch tích hợp điện tử đầu tiên được xây dựng bởi Jack Kilby (US) • Nhận giải Nobel Vật lý năm 2000. • Cũng năm 1958, Tổ chức Advanced Research Projects Agency (ARPA) được thành lập ở US Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 55 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 56 14
  15. • 1965: Margaret Belle (Oakley) Dayhoff (US) khởi động việc xây dựng tập bản đồ (atlas) của trình tự và cấu trúc protein. Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 57 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 58 • 1969: Mạng ARPANET được tạo ra bằng cách nối các máy tính của Stanford • 1968: (Tin học) Giao thức mạng chuyển University, UCSB, The University of Utah và mạch gói (packet-switching network UCLA lại với nhau. protocols) được trình diễn bởi ARPA Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 59 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 60 15
  16. • 1970: Chi tiết của thuật toán Needleman- • 1971: Raymond Samuel Tomlinson phát Wunsch về việc so sánh các trình tự được minh ra email, hiện thực đầu tiên trên mạng xuất bản. ARPANET. Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 61 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 62 • Paul Berg nhận giải Nobel Hóa • 1972: Phân tử DNA tái tổ hợp (recombinant học 1980 DNA) đầu tiên được tạo ra bởi Paul Berg cùng với (US) và nhóm của ông ta Sanger và • Margaret Dayhoff xây dựng Protein Gilbert Sequence Database (PSD) Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 63 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 64 16
  17. • 1973: Protein Data Bank ở Brookhaven National Laboratories được công bố (Acta. Cryst. B, 1973, 29: 1746). • 1973: Stanley Cohen phát minh ra việc nhân bản DNA. Nhận giải Nobel Y khoa 1986 • Stanley Cohen • 1973: Robert Melancton Metcalfe (US) đưa nhận giải Nobel Y ra Ethernet trong luận án tiến sĩ của mình. học 1986 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 65 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 66 • 1975: Microsoft Corporation được thành lập bởi Bill Gates và Paul Allen. • 1974: Vint Cerf và Robert Kahn phát triển khái niệm • 1975: E. M. Southern công bố phương pháp kết nối mạng các máy tính để phát hiện của một chuỗi DNA cụ thể trong thành "internet”; đồng thời các mẫu DNA gọi là Southern Blot (J. Mol. phát triển giao thức TCP Biol., 98: 503-517, 1975). Transmission Control Protocol TCP). Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 67 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 68 17
  18. • 1981: Thuật toán Smith-Waterman về việc bắt cặp trình tự (sequence alignment) được công bố • 1980: Trình tự gene đầy đủ đầu tiên của một sinh vật (Bacteriophage FX174) được công • 1981: IBM giới thiệu máy tính cá nhân bố; nó bao gồm 5.386 cặp base trong đó có (Personal Computer) ra thị trường 9 mã protein. Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 69 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 70 • 1983: Phản ứng PCR (Polymerase Chain Reaction) được mô tả bởi Kary Banks Mullis (US, nhận giải Nobel Hóa học 1993) và đồng nghiệp. Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 71 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 72 18
  19. • 1984: Hãng Apple công bố máy tính • 1985: Thuật toán FASTP được công bố bởi Macintosh Lipman và Pearson • National Center for Biotechnology Information (NCBI) được thành lập. Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 73 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 74 • 1986: Thuật ngữ "Genomics" xuất hiện lần đầu tiên để mô tả các nguyên tắc khoa học của việc sắp xếp (mapping), phân tích trình tự gene. Thuật ngữ này được đặt ra bởi Thomas Roderick thông qua tên của một tạp chí • Cơ sở dữ liệu SWISS-PROT được tạo bởi • 1987: Perl (Practical Extraction Report Department of Medical Biochemistry, Language) được đưa ra bởi Larry Wall University of Geneva và European Molecular Biology Laboratory (EMBL). Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 75 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 76 19
  20. • 1988: Bản đồ vật lý của E.coli được công bố • Sáng kiến về dự án gene người được khởi • 1990: Chương trình BLAST program động (Altschul, et al.) được hiện thực • Thuật toán FASTA để so sánh trình tự được • Đặc tả HTTP 1.0 được công bố. Tim công bố bởi Pearson và Lipman. Berners-Lee công bố văn bản HTML đầu • Des Higgins, Paul Sharpe thông báo phát tiên. triển phần mềm CLUSTAL Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 77 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 78 • 1991: CERN thông báo tạo ra giao thức để • 1992: Human Genome Systems được hình hiện thực World Wide Web. thành bởi William Haseline. • Linus Torvalds công bố về hệ điều hành • The Institute for Genome Research (TIGR) giống như Unix, sau này có tên gọi là Linux. được thành lập bởi Craig Venter ở Rockville. Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 79 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 80 20
  21. • 1995: Sun Microsystems đưa ra version 1.0 • 1994: The PRINTS của ngôn ngữ Java. Sun và Netscape đưa ra database of protein version 1.0 của JavaScript motifs được công bố bởi Attwood và Beck • Haemophilus influenzea và Mycoplasma genitalium genome được giải trình tự Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 81 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 82 • 1997: The genome for E. • 1996: Affymetrix là chip coli (4.7 Mbp) được công DNA thương mại đầu tiên. bố. Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 83 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 84 21
  22. • 1998: The Swiss Institute of Bioinformatics • 2001: The human được thành lập như một tổ chức phi lợi genome (3.000 Mbp) nhuận. được công bố. Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 85 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 86 • Khám phá cơ chế điều hòa hệ thống vận chuyển trong tế bào. • Qua đó giải mã được những bí ẩn về cách thức các tế bào tổ chức hệ thống vận chuyển Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 87 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 88 22
  23. • Các tín hiệu hóa học được gọi là tín hiệu dẫn truyền thần kinh được gửi từ một tế bào thần • Giải Nobel năm 2013 ba nhà khoa học đã kinh này đến tế bào thần kinh khác. giải mã được bí ẩn về cách thức các tế bào tổ chức hệ thống vận chuyển của nó. • Các phân tử này được vận chuyển xung quanh tế bào trong các gói nhỏ được gọi là • Mỗi tế bào là một nhà máy sản xuất và xuất túi. Họ đã phát hiện ra các nguyên lý phân tử khẩu sản phẩm là các phân tử. quản lý cách thức vận chuyển hàng hóa đến • Chẳng hạn, insulin được sản xuất và xuất đúng nơi và đúng lúc trong tế bào vào máu [ icine/laureates/2013/press.html] Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 89 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 90 Nobel Y Sinh 2014 Nobel 2015 • Không có gì đặc sắc cho giải Nobel sinh lý học năm 2015. Giải này trao cho ba nhà khoa học: – Ông William C. Campbell (Đại học Drew, New Jersey, Mỹ), • Khám phá ra khả nẳng tế bào tạo thành một – Ông Satoshi Omura (Đại học Kitasato, Tokyo, hệ thống định vị trong não. Nhật Bản) • Từ đó giải mã khả năng định hướng trong – Bà Tu Youyou (Học viện Y học cổ truyền Trung không gian của động vật và và con người. Quốc) • Về bệnh sốt rét và mù vĩnh viễn. Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 91 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 92 23
  24. • Trong khi đó giải Nobel về Hóa học có giá trị về Sinh học rất cao Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 93 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 94 • Ba nhà khoa học (Omas Lindahl - Thụy Điển, Paul Modrich - Mỹ và Aziz Sancar - • Viện HK Khoa học Thụy Điển công bố: Thổ Nhĩ Kỳ) được trao giải cho công trình “Nghiên cứu này giúp cung cấp những tri nghiên cứu về cơ chế sửa chữa DNA trong tế thức vô cùng quan trọng về chức năng của tế bào, nhằm ngăn chặn những lỗi bất thường bào, đồng thời mở ra những phương pháp xảy ra đối với thông tin di truyền (genetic mới trong điều trị ung thư” information). Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 95 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 96 24
  25. Như chúng ta biết • Một đoạn thang xoắn của DNA được tách ra, một RNA thông tin (mRNA - một đoạn thang • Một trong những chức năng quan trọng của đơn đặc biệt) tiếp hợp với đoạn vừa tách ra DNA đó là lưu trữ các bản thiết kế từ đó giúp này để copy “bản thiết kế” rồi đi ra khỏi nhân các tế bào tạo ra vô vàn protein trong cơ thể tế bào của một sinh linh. • Từ đó mang tới nơi sản xuất Protein – đó là các Riboxom không nằm trong nhân. Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 97 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 98 • Như vậy DNA là “bản thiết kế gốc” được lưu trữ trong mỗi tế bào chuyên biệt • Đồng thời, có một chương trình để kiểm soát và sửa chữa kịp thời các sai sót trong quá trình nhân bản và hoạt động tạo ra sự sống (protein) sử dụng “bản thiết kế gốc” này MỘT SỐ KẾT QUẢ GẦN ĐÂY Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 99 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 100 25
  26. 3/2013 • Tạo ra phôi người: – Lấy các tế bào da trên cơ thể – Shoukhrat Mitalipov, một nhà nghiên cứu của một em bé 8 tháng tuổi rồi đặt Oregon Health & Science University, tại Mỹ, nhân của tế bào này vào bên cùng các đồng nghiệp đã áp dụng kỹ thuật nhân trong trứng (của phụ nữ tình bản vô tính để tạo ra phôi thai người. nguyện cung cấp) mà họ đã bỏ nhân. – Sau đó dùng điện để kích thích trứng phát triển thành phôi thai. – Từ đó tế bào gốc được chiết xuất ra Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 101 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 102 • Nhóm này đã lấy tế bào gốc trên phôi thai và • Giới khoa học lấy tế bào gốc, hay tế bào kiểm tra. mầm từ phôi thai người. Tuy nhiên, một bộ • Mitalipov thông báo: kết quả cho thấy những phận học giả và dư luận phản đối việc khai tế bào gốc đó có thể biến thành mọi loại tế thác tế bào gốc từ phôi thai vì cho rằng đó là bào như tế bào thần kinh, tế bào gan và tế hành động vô đạo đức. bào tim. Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 103 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 104 26
  27. • Vì thế, trong nhiều năm qua, các nhà khoa học đã cố gắng tìm kiếm những giải pháp để tạo ra nguồn cung cấp tế bào mầm khác để thay thế phôi thai. – Kết quả của nhóm ở Đại học Y tế và Khoa học Oregon có giá trị do cách tiếp cận này Shinya Yamanaka và John Gurdon đoạt giải Nobel Y học 2012 khám phá sự tái lập trình của tế bào (tái tạo) để trở thành đa năng Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 105 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 106 18/6/2013 • Tiến sĩ Tak Mak, Canada cho biết nhóm nghiên cứu • Thuốc này có tác dụng gây ức chế PLK4, của ông (tại Princess một loại enzyme có vai trò quan trọng trong Margaret Cancer Centre) việc phân chia tế bào, đặc biệt là các tế bào phát triển thuốc CFI- ung thư. 400.945 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 107 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 108 27
  28. 28/6/2013 • Kỹ thuật: lấy máu từ đuôi một con chuột rồi • Nhóm nghiên cứu tại Trung tâm Riken phân lập bạch huyết cầu, sau đó chuyển BioResource, TP Tsukuba, tỉnh Ibaraki, Nhật nhân của bạch huyết cầu sang một tế bào Bản dẫn đầu bởi nhà khoa học Atsuo Ogura. trứng mà họ đã bỏ nhân. Đã dùng một tế bào máu Tế bào trứng phát triển trong hệ tuần hoàn của một thành một con chuột chú chuột để tạo ra bản sao cái. Con chuột này sinh của chính nó. trưởng bình thường và đẻ một số con. Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 109 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 110 12/9/2013 • Một nhóm các nhà khoa học Nhật Bản thuộc Viện nghiên cứu Riken, Viện nghiên cứu Y Sinh và Bệnh viện Sáng tạo ở Kobe đã cấy • Tế bào gốc đa năng (iPS), một dạng tế bào ghép thành công tế bào võng mạc được phát gốc do GS. Shinya Yamanaka phát triển, có triển từ các tế bào gốc đa năng cho một phụ thể sinh trưởng để thành các mô khác nhau nữ khoảng 70 tuổi trên cơ thể người • Đây là lần đầu tiên các tế bào gốc đa năng được đưa vào cơ thể người thông qua phẫu thuật. Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 111 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 112 28
  29. 21/9/2015 • Người ta đặt tên là Bacillius F; qua phân • Các nhà khoa học người Nga đã phát hiện tích, phát hiện ra vi khuẩn này không những loài vi khuẩn đang sống khỏe mạnh trong sống lâu mà còn có thể được dùng để kéo tầng băng vĩnh cửu tại nước Cộng hòa dài sự sống của những loài khác. Sakha, vùng Siberia của Nga cách đây 3,5 triệu năm. • Một vấn đề đặt ra là liệu loài vi khuẩn này là chìa khóa kéo dài sự sống của con người. Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 113 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 114 • Họ đã cấy vào một số cơ quan của chuột, • Bacillus F đã kích thích sự phát triển và hoạt ruồi giấm và cây trồng. động của hệ miễn dịch. Thử nghiệm trên tế – Kết quả vi khuẩn đã tăng cường và thúc đẩy sự bào hồng cầu và bạch cầu người cũng cho phát triển của hệ miễn dịch ở các cơ quan đó. kết quả rất khả quan. • Họ vẫn chưa biết chính xác cơ chế hoạt động • Các nhà khoa học tiếp tục nghiên cứu nhằm của nó mặc dù biết được sự tác động. xác định chính xác gene nào quy định khả – Từ đó họ cho rằng, có thể tồn tại những thứ bất năng kỳ diệu nói trên của Bacillus F. Đây tử ở đâu đó; chúng không thể chết và có thể tự không phải là điều đơn giản, mà phức tạp bảo vệ mình trước mọi thứ. giống như chữa bệnh ung thư vậy. Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 115 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 116 29
  30. 1.2. Định nghĩa tin sinh học • Lĩnh vực khoa học kết hợp giữa sinh học (sinh học phân tử) và tin học. • Sử dụng máy tính và tư duy thuật toán để phân tích, rút trích thông tin và quản lý các dữ liệu liên quan đến sinh học phân tử. • Nói cách khác, giải quyết các bài toán nảy ĐỊNH NGHĨA TIN SINH HỌC sinh từ sinh học phân tử sử dụng phương pháp luận của tin học. Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 117 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 118 • Một số thuật ngữ sử dụng mang ý nghĩa • Đôi khi người ta dùng “Sinh học tính toán” chung như: (Computational Biology) trong trường hợp – bioinformatics muốn sử dụng các công cụ toán học, tin học – computational biology để trích rút các thông tin hữu ích từ những dữ – computational molecular biology liệu hỗn độn. – biocomputing Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 119 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 120 30
  31. • Chẳng hạn, – khai phá dữ liệu, – lắp ráp (assembly) những trình tự DNA chất lượng cao từ các đoạn DNA ngắn thu nhận từ kỹ thuật xác định trình tự DNA (shotgun sequencing) – dự đoán quy luật điều hòa gen (gene regulation) với dữ liệu từ các mRNA, microarray hay khối SỰ CẦN THIẾT phổ (mass spectrometry) Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 121 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 122 1.3 Sự cần thiết Một số ngân hàng dữ liệu • GenBank • EMBL (European Molecular Bioinformatic • Phát triển các cơ sở dữ liệu về thông tin sinh Laboratory) học là một nhiệm vụ quan trọng, để có được • Swissprot một kho lưu trữ lớn. • PDB (Protein Databank) • Nhiều cơ sở dữ liệu sinh học lớn trên thế giới đã hình thành và phát triển. • SCOP (Strutural Classification Of Proteins Database) • PRINTS (Protein Motif fingerprint database) Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 123 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 124 31
  32. • Với các ngân hàng dữ liệu, giúp: – Tìm kiếm các gene trên các trình tự DNA ở các sinh vật khác nhau. – Phát triển các phương pháp nhằm dự đoán cấu – Tập hợp các trình tự có sự tương đồng cao vào trúc, chức năng của các protein mới được phát các lớp chung, từ đó đưa ra cấu trúc protein. hiện (Hình vẽ). – So sánh các trình tự protein tương đồng và thành lập cây phả hệ mô tả mối quan hệ tiến hóa. ! Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 125 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 126 • Ngoài việc phát triển các ngân hàng dữ liệu • Chẳng hạn, để lưu trữ (CSDL), còn có việc giải mã để – bệnh Alzheimer bị biến dị làm đột biến 4 gen hiểu biết và hiệu chỉnh. thuộc các nhiễm sắc thể số 1, 14, 19, 21. • Đây là những vấn đề lớn, đòi hỏi sự hợp tác – Nhưng trong các nhiễm sắc thể này thì gen nào của nhiều ngành. quyết định sự biến dị đó. Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 127 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 128 32
  33. • Dưới kính hiển vi điện tử, khi xem xét mô não về tế bào học thấy có tổn thương về mặt sinh • Người ta chỉ biết sự thể hiện (triệu chứng): học, người bị Alzheimer có sự mất tế bào thần – đó là sự thoái hóa của các sợi dây thần kinh, kinh và giảm thể tích những vùng não chi – hoặc bị tổn thương chỉ còn là những ống nhỏ phối trí nhớ - vùng đảm nhận tâm thần kinh • Từ đó ngăn cản vận chuyển chất dinh dưỡng nuôi tế bào thần kinh Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 129 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 130 – Những chất này nằm xung quanh các tế bào thần kinh chết, – Một loại protein có tên Amyloid precursor (APP) cũng tồn tại ở đây giúp cho hoạt động hủy hoại • Nghiên cứu tiếp, thấy rằng: tế bào thần kinh của Beta Amyloid – Vấn đề này liên quan đến một protein tên là Tau. – Và sự xuất hiện protein beta Amyloid - không hòa tan nên tích tụ thành những mảng keo. Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 131 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 132 33
  34. • Sự có mặt quá nhiều của Beta Amyloid sẽ làm giảm chất trung gian dẫn truyền thần kinh acetylcholine cần thiết cho trí nhớ. • Beta Amyloid là một • Beta Amyloid cũng ngăn chặn sự vận peptide có từ 36 – 43 chuyển ion kali, natri, calcium qua màng tế amino acid bào (giúp cho quá trình truyền tín hiệu thần kinh) Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 133 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 134 • Người ta thấy rằng trên nhiễm sắc thể 19 có một gene có ý nghĩa y tế rất lớn, nó được gọi • Vấn đề đặt ra là với những biểu hiện như là gene APOE; trình tự DNA của gene này vậy, liệu con người có thể có những hiểu biết gồm 897 chữ. để kiểm soát quá trình phát triển này. • Nucleotid thứ 334 thường là A, nhưng trong một số người lại là G. Những người này có khả năng lớn sẽ bị bệnh Alzheimer. Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 135 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 136 34
  35. • Từ đó hướng đến việc • Vấn đề lớn đối với tin sinh học hiện nay là – chuyển đổi thông tin trình tự sinh học sang các tri làm sao để các thông tin về các trình tự sinh thức hóa sinh và lý sinh; học phục vụ thiết thực hơn nữa cho sự sống, – giải mã các đầu mối tiến hóa; không dừng ở mức độ lưu trữ thông tin. – chẩn đoán cấu trúc và chức năng của các cơ thể sống. Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 137 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 138 • Bệnh này được đặt tên từ hình dạng của các • Chẳng hạn, với bệnh tế bào thiếu máu hình tế bào máu lưỡi liềm (sickle cell amenia), • Trong một điều kiện nào đó hồng huyết cầu • Đây là một bệnh di truyền ảnh hưởng đến (red blood cell) bị biến dạng thành hình lưỡi Hemoglobin hay Haemoglobin (huyết sắc tố) liềm – phân tử vận chuyển dưỡng khí (oxygen) • và tế bào này kéo dài ra làm cho một số trong máu. mạch máu nhỏ của cơ thể không nhận đủ lượng oxy cần thiết. Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 139 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 140 35
  36. • Bệnh này được gây ra bởi một sự thay đổi mã chữ cái trong trình tự DNA, nó làm cho một amino acid của protein hemoglobin là Glutamic acid bị thay bởi Valine. • Valine làm cho các phân tử hemoglobin dính lại cùng nhau, hình thành các sợi dài bóp méo hình dạng của các hồng huyết cầu, dẫn đến tình trạng người khỏe mạnh bình thường trở nên thiếu máu trầm trọng. Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 141 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 142 • Như vậy, Với DNA trên mạch GAG (CTC) khi phiên mã sang mRNA sẽ là GAG (đây là amino acid có tên Glutamic acid). • Tuy nhiên, do sự biến đổi, GAG thay bởi GTG (CAC), và được phiên mã sang mRNA thành GUG. Mà đó là một amino acid có tên là Valine. Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 143 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 144 36
  37. • Với người nghiên cứu về tin học: – Protein như một bài văn, – Mà các câu văn là các trình tự Peptide – Những từ của câu văn đó là các Amino acid – Các chữ cái là A, C, G, T dùng để tạo nên từ • Vấn đề làm sao biết quy tắc văn phạm để tạo nên câu, tạo nên bài văn. Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 145 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 146 1.4. Một số khái niệm cơ bản • Đại phân tử sinh học: hay đa phân tử sinh học (biopolymer) là một đa phân tử (polymer) có trong các cơ thể sống. • Có 4 đại phân tử không thể thiếu để hình MỘT SỐ KHÁI NIỆM CƠ BẢN thành nên cơ thể sống; đó là: Một chút về lịch sử Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 147 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 148 37
  38. • Protein • Về mặt tổ chức, đây là • Nucleic acid những hợp chất cấu tạo nên từ nhiều phân tử • Polysaccharide • Quan trọng hơn cả là: cùng hoại, gọi là đơn • Lipid – Nucleic acid: lưu trữ thông tin di truyền phân tử (monomer) – Protein: biểu hiện của vật chất sống • Chúng liên kết với nhau bằng liên kết cộng hóa trị. Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 149 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 150 • Một đặc điểm quan trọng là cấu trúc và tính chất hoá lý của các Nucleic acid, Lipid, • Còn: Polysaccharide tương đối đồng nhất, – Polysaccharide: tham gia cấu tạo tế bào, là • Nhưng Protein lại đa dạng về cấu trúc và nguồn dự trữ năng lượng chính chức năng. – Lipid: thành phần của màng tế bào, được cấu tạo từ các acid béo; là nhân tố chính để hình thành các màng sinh học. Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 151 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 152 38
  39. • Ngoài ra, như đã nói ở trên, tất cả các đại phân tử sinh học đều được cấu thành từ một • Chẳng hạn, số đơn vị cấu tạo đơn giản và kết nối với – Nucleic acid được hình thành từ nucleotide, các nhau rất chặt chẽ đó là các đơn phân tử nucleotide này bao gồm phosphate, đường (monomer). pentose và base hữu cơ – Protein được hình thành từ các amino acid – Polysaccharide được hình thành từ các monosaccharide Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 153 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 154 Nucleic acid • Thực chất Nucleic acid là vật chất mang thông tin di truyền của các cơ thể sống, được hình thành từ các phân tử nucleotide. • Mỗi nucleotide gồm 3 thành phần: – Phosphate NUCLEIC ACID – Đường Pentose – Và một Base hữu cơ Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 155 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 156 39
  40. • Đại phân tử Nucleic acid gồm 2 loại đa phân tử giống nhau: – DNA: Deoxyribonucleic Acid • Do các Nucleotide chỉ khác nhau ở thành – RNA: Rebonucleic Acid phần Base hữu cơ, • Nên thỉnh thoảng người ta thường dùng thuật ngữ Base thay cho Nucleotide. Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 157 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 158 Deoxyribonucleic Acid • Đại phân tử DNA là chuỗi xoắn kép gồm 2 mạch đơn, mỗi mạch đơn là một chuỗi nucleotide. DEOXYRIBONUCLEIC ACID Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 159 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 160 40
  41. Deoxyribonucleic Acid • Các nucleotide trong một mạch đơn liên kết với nhau bằng liên kết cộng hóa trị • Chuỗi nucleotide của DNA bao gồm – là liên kết được hình thành giữa đường của nucleotide này với phosphate của nucleotide kế – Phosphate, tiếp. – Đường Desoxyribose • Hai mạch đơn liên kết với nhau bằng liên kết – Và một trong 4 base hữu cơ là Adenine (A), hydro hình thành giữa các base Cytosine (C), Guanine (G) và Thymine (T). – là tương tác tĩnh điện yếu giữa phần tử Hydro mang điện tích dương với phần tử mang điện tích âm Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 161 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 162 • Trong hai mạch đơn liên kết với nhau thì: – G của mạch này liên kết với C của mạch kia • Lưu ý rằng, do DNA là một chuỗi xoắn kép – A của mạch này liên kết với T của mạch kia và liên kết giữa 2 chuỗi được thông qua liên kết giữa A-T và C-G. • Nên trong trình tự DNA người ta thường gọi AT và CG là các cặp base (base pair). • Từ đó, chiều dài của trình tự DNA thường được đo bằng base pase (bp) Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 163 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 164 41
  42. Cấu trúc DNA • Do các Nucleotide chỉ khác nhau thành phần base hữu cơ, • Nên đại phân tử DNA như là một trình tự sinh học (Biology sequence) gồm các base là: – A (Adenine), – C (Cytosine), – G (Guanine), – T (Thymine). Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 165 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 166 C5H6N2O2 C5H5N5 • Điều này rất thuận lợi khi biểu diễn các đại phân tử DNA trên máy tính bằng chuỗi ký tự chứa bốn ký tự chữ A, C, G, T • Như vậy, với một chuỗi nucleotid được người nghiên cứu về tin học coi đó như là một chuỗi gồm 4 ký tự chữ như trên C4H5N3O C5H5N5O Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 167 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 168 42
  43. • Khi đó, số lượng chuỗi nuleotide sẽ rất lớn – Ví dụ, một chuỗi có 10 nucleotide, thì số loại DNA khác nhau là 410 = 220 = 1.048.576 REBONUCLEIC ACID Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 169 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 170 Ribonucleic Acid • Trong tế bào có 3 loại RNA chính, • Đại phân tử RNA tương tự DNA nhưng có 3 tham gia vào quá trình dịch mã điểm khác nhau: sang protein: – Là chuỗi xoắn đơn – mRNA (messenger RNA) – Đường Pentose là Ribose – tRNA (transfer RNA) – Thymine được thay bởi Uracil (U) – rRNA (ribosomal RNA C4H4N2O2 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 171 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 172 43
  44. • mRNA: là các RNA thông • tRNA: là các RNA vận chuyển, đóng vai trò tin. vận chuyển các amino acid đến bộ máy dịch – Đây chính là các bản sao của mã để tổng hợp ra protein từ mRNA tương các trình tự trên DNA, nhằm ứng. chuyển thông tin mã hóa trên DNA đến bộ máy giải mã protein tương ứng. Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 173 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 174 • rRNA: là các RNA của risbosome, rRNA này chiếm phần lớn tổng số RNA của tế bào. • Ribosome là một thành phần trong bộ máy dịch mã của tế bào, được tạo thành bằng cách kết hợp rRNA với protein PROTEIN Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 175 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 176 44
  45. Amino acid • Cấu trúc bao gồm – một nguyên tử carbon ở trung tâm, nguyên tử carbon này được gắn với nguyên tử Hydro và • Amino acid được cấu thành từ các base trên được gọi là nguyên tử C-α (α-carbon) trình tự DNA, – Nguyên tử C-α liên kết với 3 thành phần khác là • Có tất cả 20 Amino acid chính nhóm amino (NH2), nhóm carboxylic (COOH) và gốc amino acid ký hiệu là R Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 177 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 178 • Các gốc amino acid khác nhau sẽ tạo ra các amino acid với tính chất hóa học khác nhau. • Chẳng hạn, với amino acid: Alanine, Serine • Trình tự các base trên DNA quyết định trình tự amino acid trên protein tương ứng. • Mỗi amino acid có 3 base, nên với 4 base A, C, G, T sẽ có số lượng amino acid lý thuyết là 43 = 64 (gọi là 64 codon) Alanine Serine Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 179 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 180 45
  46. • Tuy nhiên, hiện nay • Margaret Oakley Dayhoff chỉ phát hiện được (American Physical Chemist, 20 amino acid với pioneer in Bioinformatics) đề mã di truyền như xuất dùng one-letter code để hình. mã hóa 20 amino acid này. Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 181 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 182 Bảng mã ký tự của 20 amino acid • Nên có hơn 1 codon mã hóa một amino acid. • Bảng mã di truyền chuẩn được Marshall Warren Nirenberg (Giải Nobel Y học 1968) và Matthaei đưa ra năm 1961 như hình Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 183 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 184 46
  47. Mã di truyền Bảng 20 amino acid • Theo bảng mã này: – chỉ có 61 codon chứa thông tin (mã hóa amino acid cụ thể) – 3 codon: UAA, UAG, UGA là dấu hiệu kết thúc – Codon AUG vừa là amino acid có tên Methionine (Met) vừa là dấu hiệu bắt đầu Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 185 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 186 Công thức hóa học của 20 amino acid • Trong 20 amino acid này có 9 amino acid gọi là thiết yếu • Bởi nó không thể được tạo ra trực tiếp từ cơ thể con người, • Mà được cung cấp thông qua nguồn thực phẩm dinh dưỡng từ bên ngoài. Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 187 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 188 47
  48. • 9 amino acid thiết yếu đó là: histidine, isoliucine, leucine, lysine, methionine, phenylalanine, threonine, tryptophan, valine. CHUỖI PEPTIDE Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 189 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 190 Liên kết peptide (Peptide bond) Chuỗi peptide • Là liên kết giữa đầu Carboxylic (COOH) của amino acid này với đầu amin (NH2) của amino acid khác và loại bỏ đi một phân tử • Là chuỗi không nhiều hơn 50 amino acid nước (H2O) trong đó các amino acid này liên kết với nhau theo liên kết peptide. • Một đầu của chuỗi là nhóm amino (H3N+) và một đầu là nhóm carboxylic (COO-) Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 191 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 192 48
  49. • Khi có nhiều hơn 50 amino acid người ta hay gọi đó là chuỗi polypeptide. • Nên thực chất: chuỗi polypeptide là một chuỗi gồm nhiều chuỗi peptid; nó dài và không phân nhánh. Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 193 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 194 • Liên kết peptide trong cấu trúc bậc một của protein là một liên kết đặc biệt, • Nhờ tính linh động này, phân tử protein có – mạnh hơn liên kết đơn nhưng lại yếu hơn liên kết thể tự xoay quanh trục của nó một góc nhỏ. đôi. • Điều này có ý nghĩa đặc biệt quan trọng • Chính điều này đã tạo cho các liên kết trong trong việc hình thành cấu trúc bậc cao của chuỗi peptide vừa có tính ổn định của một protein. liên kết đôi, vừa có tính linh động của một liên kết đơn. Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 195 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 196 49
  50. Cấu trúc bậc I • Do amino acid là các đơn phân tử cấu thành nên protein, nên chuỗi peptid hay polypeptide là protein. • Trong trường hợp chỉ quan tâm đến các liên kết peptide trong CẤU TRÚC PROTEIN chuỗi này, ta có cấu trúc bậc 1 của protein (protein primary structure) Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 197 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 198 Cấu trúc bậc II Cấu trúc bậc III • Khi các amino acid gần nhau liên kết với nhau thông qua liên kết hydro giữa • Ngoài các liên kết hydro để tạo ra cấu trúc nhóm amin (NH) của amino acid này bậc II, các nhóm amino acid trên chuỗi với nguyên tử Oxy của amino acid polypeptide còn liên kết lại cùng nhau. khác sẽ tạo nên vòng xoắn của chuỗi • Chẳng hạn, các Cystein sẽ liên kết với nhau, polypeptide. hoặc các Proline liên kết với nhau để hình • Khi đó có cấu trúc bậc II của protein thành nên các nhóm riêng. (secondary structure) Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 199 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 200 50
  51. Cấu trúc bậc IV • Khi có nhiều hơn một chuỗi polypeptite với các cấu trúc bậc III được liên kết với nhau, sẽ • Khi đó tạo nên cấu trúc tạo nên cấu trúc protein bậc IV (Quaternary không gian (3 chiều) của structure) tất cả các nguyên tử trong phân tử protein. Gọi là cấu trúc bậc III (Protein tertiary structure) Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 201 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 202 Tổng kết • Protein chiếm phần lớn cấu trúc của tế bào và hành động như những enzyme xúc tác vào các phản ứng tế bào • Có 20 amino acid, và 9 trong số đó là rất cần thiết cho chế độ ăn uống của con người. • Tổng hợp: amino acid, peptid bond, protein GIẢI TRÌNH TỰ (SEQUENCING) structure Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 203 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 204 51
  52. CODON – Có tất cả 64 codon, trong đó có • Như đã có 1 codon mở đầu là AUG (gọi là start codon), gọi là – Bộ ba mã hóa (codon) đóng vai trò dịch mã tế Methionine đóng vai trò mở đầu của quá trình dịch mã bào 3 codon (UAA, UAG, UGA) gọi là codon kết thúc (stop codon) – Mỗi codon mã hóa cho một amino acid để cấu còn lại 61 codon mã hóa cho 20 amino acid. tạo nên đại phân tử protein Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 205 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 206 ORF • Open Reading Frame – ORF • Trong quá trình dịch mã, phân tử mRNA – Là một đoạn trình tự DNA có khả năng dịch mã mang thông tin di truyền từ nhân ra ngoài tế thành một chuỗi polypeptide. bào chất với trình tự là các codon tương ứng – Một ORF được bắt đầu bởi start codon và kết với trình tự amino acid sắp được tổng hợp. thúc bởi stop codon • Gene: là một ORF mã hóa cho một protein Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 207 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 208 52
  53. Minh họa Chẳng hạn • Có thể truy cập trang web Sequence Manipulation Siute (Ver 2.0) tại để thực hiện các thao tác liên quan đến trình tự sinh học. Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 209 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 210 Sau khi đã có trình tự, tìm ORF Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 211 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 212 53
  54. Sequencing • Mục đích là tìm ra nucleotide trong gene • Frederick Sanger đưa ra phương pháp giải trình tự vào năm 1977, gọi là Sanger Sequencing. • Kĩ thuật phổ biến gọi là “chain termination“, sử dụng Defective DNA nucleotide (tức là nucleotide bị chỉnh sửa làm mất khả năng kết hợp thêm một nucleotide khác tại đầu 3′của nó) Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 213 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 214 54