Kiến trúc máy tính và hợp ngữ - Tổ chức hoạt động vi xử lí
Bạn đang xem 20 trang mẫu của tài liệu "Kiến trúc máy tính và hợp ngữ - Tổ chức hoạt động vi xử lí", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
Tài liệu đính kèm:
- kien_truc_may_tinh_va_hop_ngu_to_chuc_hoat_dong_vi_xu_li.pdf
Nội dung text: Kiến trúc máy tính và hợp ngữ - Tổ chức hoạt động vi xử lí
- Môn học: Kiến trúc máy tính & Hợp ngữ
- • Là loại ngôn ngữ nhân tạo (Ví dụ: C/C++) được cấu thành bởi 2 yếu tố chính: – Từ vựng: là các keyword (struct, enum, if, int ) – Ngữ pháp: syntax (if( ){} else{}, do{} while() ) • Ngôn ngữ lập trình giúp cho người sử dụng nó (gọi là lập trình viên) có thể diễn đạt và mô tả các hướng dẫn cho máy tính hoạt động theo ý muốn của mình • Độ phức tạp (trừu tượng) của các hướng dẫn này quyết định thứ bậc của ngôn ngữ – Độ phức tạp càng cao thì bậc càng thấp – Ví dụ: C Sharp (C#) là ngôn ngữ bậc cao hơn C 2
- • Ngôn ngữ nào mà con người dễ hiểu nhất lại là ngôn ngữ máy tính “khó hiểu” nhất – Ngôn ngữ bậc càng cao thì con người càng dễ hiểu nhưng máy tính lại càng “khó hiểu” • Nhưng máy tính lại là nơi chúng ta cần nó hiểu đúng và nhanh nhất để có thể thực thi những gì chúng ta muốn Ngôn ngữ máy (Machine language) If (n>0) OK ??? If (n>0) { { n=-1; n=-1; } } 3
- • Ngôn ngữ máy cho phép người lập trình đưa ra các hướng dẫn đơn giản mà bộ vi xử lý (CPU) có thể thực hiện được ngay • Các hướng dẫn này được gọi là chỉ thị / lệnh (instruction) hoặc mã máy (machine code) • Mỗi bộ vi xử lý (CPU) có 1 ngôn ngữ riêng, gọi là bộ lệnh (instruction set) • Trong cùng 1 dòng vi xử lý (processor family) bộ lệnh gần giống nhau Instruction set 4
- • Là dãy bit chứa yêu cầu mà bộ xử lý trong CPU (ALU) phải thực hiện • Instruction gồm 2 thành phần: – Mã lệnh (opcode): thao tác cần thực hiện – Thông tin về toán hạng (operand): các đối tượng bị tác động bởi thao tác chứa trong mã lệnh 5
- • Tập lệnh dành cho những bộ vi xử lý có kiến trúc tương tự nhau • Một số ISA thông dụng: – Dòng vi xử lý 80x86 (gọi tắt x86) của Intel • IA-16: Dòng xử lý 16 bit (Intel 8086, 80186, 80286) • IA-32: Dòng xử lý 32 bit (Intel 80368 – i386, 80486 – i486, Pentium II, Pentium III ) • IA-64: Dòng xử lý 64 bit (Intel x86-64 như Pentium D ) – MIPS: Dùng rất nhiều trong hệ thống nhúng (embedded system) – PowerPC của IBM 6
- • Có 2 trường phái thiết kế bộ lệnh: – Complete Instruction Set Computer (CISC): bộ lệnh gồm rất nhiều lệnh, từ đơn giản đến phức tạp – Reduced Instruction Set Computer (RISC): bộ lệnh chỉ gồm các lệnh đơn giản • Nên chọn kiểu nào? 7
- • Không phải ai cũng muốn / có thể lập trình ngôn ngữ máy vì quá khó hiểu so với ngôn ngữ bình thường của con người Nhu cầu cần có bộ phận phiên dịch (interpreter) High-level Machine language Interpreter Laguage (C/C++) OK OK 8
- • Trong 1 số trường hợp, việc viết bằng ngôn ngữ cấp “quá cao” trở nên chạy khá chậm vì phải phiên dịch nhiều lần để trở thành ngôn ngữ máy Hợp ngữ (Assembly language) Highest-level Lower-level Lower-level Interpreter Machine language language language Laguage 9
- • Các mã máy chỉ là các con số (0 / 1) • Trong ngôn ngữ máy không có khái niệm biến thay vào đó là địa chỉ ô nhớ, thanh ghi (lưu trữ mã lệnh, dữ liệu) • Để dễ dàng lập trình hơn dùng ký hiệu mã giả thay cho các số biểu diễn địa chỉ ô nhớ, các tên (label, tên biến, tên chương trình) • Hợp ngữ rất gần với ngôn ngữ máy nhưng lại đủ để con người hiểu và sử dụng tốt hơn ngôn ngữ máy – Ví dụ: Ghi giá trị 5 vào thanh ghi $4 10 Ngôn ngữ máy: 00110100 0000100 00000000 00000101
- • Vì mỗi bộ vi xử lý có 1 cấu trúc thanh ghi và tập lệnh (ngôn ngữ) riêng nên khi lập trình hợp ngữ phải nói rõ là lập trình cho bộ vi xử lý nào, hay dòng (family) vi xử lý nào – Ví dụ: • Hợp ngữ cho MIPS 11 • Hợp ngữ cho dòng vi xử lý Intel 80x86
- • Ta có thể hình dung như sau: What is it? What is it? High-level Assembly Machine language Compiler language Assembler Laguage temp = v[k]; lw $t0, 0($2) 0000 1001 1100 0110 v[k] = v[k+1]; lw $t1, 4($2) 1111 0101 v[k+1] = temp; sw $t1, 0($2) sw $t0, 4($2) 12
- • Trình biên dịch ngôn ngữ cấp cao hợp ngữ • Compiler phụ thuộc vào: – Ngôn ngữ cấp cao được biên dịch – Kiến trúc hệ thống phần cứng bên dưới mà nó đang chạy – Ví dụ: 13 • Compiler cho C <> Compiler cho Java
- • Trình biên dịch hợp ngữ ngôn ngữ máy • Một bộ vi xử lý (đi kèm 1 bộ lệnh xác định) có thể có nhiều Assembler của nhiều nhà cung cấp khác nhau chạy trên các OS khác nhau – Ví dụ: Cùng là kiến trúc x86, nhưng có thể dùng A86, GAS, TASM, MASM, NASM • Assembly program phụ thuộc vào Assembler mà nó sử dụng (do các mở rộng, đặc điểm khác nhau giữa các Assembler) 14
- • Bản thân Compiler cũng là chương trình, vậy nó được biên dịch bằng gì? Assembler • Sau khi đã biên dịch tập tin mã nguồn ngôn ngữ cấp cao thành tập tin mã máy (machine language), làm sao để chạy những tập tin này trên máy tính? Linker & Loader 15
- • Thực tế khi lập trình, ta sẽ dùng nhiều file (header / source) liên kết và kèm theo các thư viện có sẵn Cần chương trình Linker để liên kết các file sau khi đã biên dịch thành mã máy này (Object file) Tập tin thực thi (ví dụ: .exe, .bat, .sh) 16
- • Khi double click vào những tập tin thực thi, cần chương trình tính toán và tải vào memory để CPU xử lý Loader 17
- • Compiler và Assembler có thể được bỏ qua trong 1 số trường hợp cụ thể • Trong thực tế, có 1 số compiler có thể tạo file thực thi ở nhiều nền tảng kiến trúc bên dưới khác nhau, được gọi là cross-platform compiler – Compiler cho Java 20 – Cygwin
- • CPU xử lý lệnh qua 2 bước, gọi là chu kỳ lệnh: – Nạp lệnh (Fetch): Di chuyển lệnh từ memory vào thanh ghi (register) trong CPU – Thực thi lệnh (Excute): Giải mã lệnh và thực thi thao tác yêu cầu Fetch next Execute Start Halt Instruction Instruction 22
- • MAR PC • MBR Memory • IR MBR • PC PC + 1 • Thanh ghi PC (Program Counter) – Lưu địa chỉ (address) của lệnh sắp được nạp • Thanh ghi MAR (Memory Address Register) • Control Unit di chuyển mã lệnh, có địa chỉ trong PC, vào thanh ghi IR – Lưu địa chỉ (address) sẽ được output ra Address bus • Thanh ghi MBR (Memory Buffer Register) • Mặc định, giá trị thanh ghi PC sẽ tăng 1 – Lưu giá trị (value) sẽ được input / output từ Data bus lượng = chiều dài của lệnh vừa được nạp • Thanh ghi IR (Instruction Register) – Lưu mã lệnh sẽ được xử lý tiếp 23
- Chương trình CPU PC 00010011 R1 x = x + y 00010000 01000000 00000001 IR ALU CPU RAM 00010000 01000000 00000001 00001100 01000010 00000001 Địa chỉ Lệnh (Instruction) 00010000 00000001 01000000 00010000 x R1 x 00010011 R1+y R1 00010110 R1 x y . 01000000 . 01000010 . 24
- • Tính địa chỉ lệnh • Nạp lệnh • Giải mã lệnh • Tính địa chỉ của toán hạng • Nạp toán hạng • Thực hiện lệnh • Tính địa chỉ của toán hạng chứa kết quả • Ghi kết quả • Các bước này được lặp đi lặp lại cho tất cả các lệnh tiếp theo • Quy trình này gọi là Instruction cycle – vòng lặp xử lý lệnh 25
- • Ngôn ngữ lập trình giống và khác ngôn ngữ tự nhiên của con người ở những điểm nào? • Tại sao cần nhiều loại ngôn ngữ lập trình: C, C++, C#, VB, Java ? • Một chương trình không khai báo biến nào cả thì có sử dụng bộ nhớ không? • Chương trình được thực thi trong RAM hay CPU? • Tại sao file .exe chỉ chạy được trên Windows mà không thể chạy trên Linux? 26
- • Sách Petterson & Hennessy: Đọc chương 2 (đọc kỹ 2.12 và 2.13) • Tài liệu tham khảo: Đọc “08_HP_AppA.pdf” 27