Bài giảng Lý thuyết hệ thống thông tin

pdf 143 trang vanle 3440
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Lý thuyết hệ thống thông tin", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfbai_giang_ly_thuyet_he_thong_thong_tin.pdf

Nội dung text: Bài giảng Lý thuyết hệ thống thông tin

  1. HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG KHOA CÔNG NGHỆ THÔNG TIN BÀI GIẢNG LÝ THUYẾT HỆ THỐNG THÔNG TIN Biên soạn: Dương Trần Đức Hà Nội - 2009
  2. MỤC LỤC Chương 1 : Hệ thống thông tin trong các tổ chức 1 1.1 Các khái niệm về thông tin 1 1.2 Hệ thống thông tin dựa trên máy tính 4 1.3 Các hệ thống thông tin nghiệp vụ 5 1.4 Hệ thống thông tin và các tổ chức 10 Chương 2: Phần cứng và phần mềm của các hệ thống thông tin 15 2.1 Phần cứng 15 2.1.1 Các thành phần phần cứng của hệ thống máy tính 16 2.1.2 Thực hiện lệnh 16 2.1.3 Thiết bị xử lý 17 2.1.4 Thiết bị nhớ 18 2.1.5 Thiết bị lưu trữ phụ 20 2.1.6 Thiết bị nhập 24 2.1.7 Thiết bị xuất 26 2.1.8 Các loại máy tính 27 2.2 Phần mềm 27 2.2.1 Phần mềm hệ thống 28 2.2.2 Phần mềm ứng dụng 31 Chương 3: Tổ chức dữ liệu và thông tin 34 3.1 Phân cấp dữ liệu 34 3.2 Quản lý dữ liệu theo phương pháp truyền thống và phương pháp CSDL 35 3.3 Mô hình hóa dữ liệu 38 3.4 Các mô hình CSDL 39 3.5 Hệ quản trị CSDL 43 3.6 Ứng dụng khác của CSDL 49 Chương 4: Mạng máy tính, mạng viễn thông, Internet, Intranet 52 4.1 Các thành phần của hệ thống viễn thông 52 4.2 Mạng và xử lý phân tán 55 4.3 Các giao thức và phần mềm truyền thông 57 4.4 Sơ lược về chức năng và hoạt động của Internet 58 4.5 Các dịch vụ truyền thông và Internet 61 4.6 Intranets và Extranets 65 4.7 Vấn đề an ninh mạng máy tính 66 Chương 5: Hệ thống thương mại điện tử và hệ thống xử lý giao dịch 67 5.1 Thương mại điện tử 67 5.2 Hệ thống xử lý giao dịch 75 i
  3. 5.3 Hệ thống hoạch định tài nguyên doanh nghiệp 81 Chương 6: Các hệ trợ giúp quyết định và quản lý thông tin 83 6.1 Ra quyết định và giải quyết vấn đề 83 6.2 Hệ thống thông tin quản lý 85 6.3 Hệ hỗ trợ quyết định 92 Chương 7: Một số hệ thống thông tin chuyên biệt 99 7.1 Trí tuệ nhân tạo 99 7.2 Hệ chuyên gia 102 7.3 Hệ thực tại ảo 107 Chương 8: Phát triển hệ thống 110 8.1 Tổng quan về phát triển hệ thống 110 8.2 Vòng đời phát triển hệ thống 113 8.3 Khảo sát hệ thống 120 8.4 Phân tích hệ thống 122 8.5 Thiết kế hệ thống 126 8.6 Thực thi hệ thống 129 8.7 Bảo trì và đánh giá lại 132 Chương 9: Ảnh hưởng của hệ thống thông tin đến xã hội và cá nhân 134 9.1 Vấn đề lãng phí và lỗi máy tính 134 9.2 Tội phạm máy tính 135 9.3 Môi trường làm việc và vấn đề sức khỏe 138 ii
  4. CHƯƠNG 1 HỆ THỐNG THÔNG TIN TRONG CÁC TỔ CHỨC Một cách tổng quan, hệ thống thông tin (Information System - IS) là một hệ thống làm việc, trong đó con người (và máy móc) thực hiện các công việc sử dụng các tài nguyên (bao gồm cả các tài nguyên công nghệ) để tạo ra các sản phNm hoặc các dịch vụ cho người sử dụng. Hệ thống thông tin là một hệ thống làm việc mà các hoạt động được dành chủ yếu cho việc xử lý thông tin (thu thập, truyền tải, lưu trữ, xử lý, hiển thị thông tin). Chương 1 giới thiệu tổng quan về hệ thống thông tin trong các tổ chức, với các nội dung sau : - Giá trị của thông tin được liên hệ trực tiếp với việc nó trợ giúp cho người ra quyết định để đạt được mục tiêu của tổ chức như thế nào. Phân biệt giữa dữ liệu (data) và thông tin (information) và mô tả các đặc điểm được sử dụng để đánh giá chất lượng của thông tin. -Nắm được các ảnh hưởng tiềm tàng của hệ thống thông tin và có khả năng áp dụng các kiến thức này vào công việc có thể mang lại những thành công trong công việc của mỗi cá nhân, tổ chức có thểđạt được mục đích, và xã hội có chất lượng cuộc sống tốt hơn. Chỉ ra các dạng hệ thống thông tin nghiệp vụ chính, ai sử dụng chúng, chúng được sử dụng như thế nào, và những lợi ích mà các hệ thống này mang lại là gì. -Người sử dụng hệ thống, người quản lý nghiệp vụ, các chuyên gia về hệ thống phải cùng làm việc với nhau để xây dựng thành công một hệ thống thông tin. Chỉ ra các bước phát triển hệ thống và mục tiêu của mỗi bước. -Việc sử dụng hệ thống thông tin làm gia tăng giá trị của tổ chức và có thể tạo ra cho tổ chức một lợi thế cạnh tranh. Chỉ ra các quá trình gia tăng giá trị trong chuỗi cung cấp và mô tả vai trò của hệ thống thông tin trong đó. Định nghĩa thuật ngữ ‘’lợi thế cạnh tranh’’ và mô tả việc các tổ chức sử dụng các hệ thống thông tin để đạt lợi thế này như thế nào. 1.1 Các khái niệm về thông tin Định nghĩa hệ thống thông tin : Là một tập hợp các thành phần thực hiện việc thu thập, xử lý, phân phối dữ liệu và thông tin, cung cấp các phản hồi để đạt được mục tiêu. Ví dụ : Máy rút tiền tựđộng ATM, hệ thống đặt vé máy bay, hệ thống đăng ký khóa học .v.v. 1
  5. Phân biệt dữ liệu và thông tin : Dữ liệu là các sự kiện ở mức thô, chưa qua xử lý. Thông tin là tập các sự kiện được xử lý và tổ chức theo cách làm cho chúng có giá trị hơn so với chính bản thân các sự kiện ban đầu. Quá trình biến đổi dữ liệu thành thông tin gọi là quá trình xử lý (process), là một tập các thao tác có liên quan đến nhau được thực hiện để đạt được kết quảđã định. Quá trình xác định các mối quan hệ giữa dữ liệu để tạo ra thông tin có ích cần có tri thức (knowledge). Tri thức là sự hiểu biết về tập các thông tin và cách mà các thông tin đó được làm cho trở nên có ích để hỗ trợ các công việc cụ thể hoặc đạt được một quyết định nào đó. Hình 1.1 Biến đổi dữ liệu thành thông tin Đặc điểm của thông tin có giá trị : Một thông tin được coi là có giá trị khi nó có các đặc điểm sau : - Chính xác : Thông tin chính xác là thông tin không có lỗi. Trong nhiều trường hợp, thông tin không chính xác được tạo ra bởi dữ liệu đầu vào của quá trình xử lý là không chính xác. - Hoàn thiện : Thông tin hoàn thiện là thông tin phải chứa tất cả các sự kiện quan trọng. Chẳng hạn một báo cáo đầu tư không chứa các chi phí quan trọng là báo cáo chưa hoàn thiện. - Tính kinh tế : Chi phí để tạo ra thông tin phải ở mức vừa phải. Người ra quyết định luôn luôn phải cân bằng giữa giá trị của thông tin và chi phí để có được nó. - Linh hoạt : Thông tin linh hoạt là thông tin có thể sử dụng được cho nhiều mục đích. Chẳng hạn thông tin về hàng hóa tồn kho có thểđược dùng bởi bộ phận bán hàng để quyết định các chương trình marketing, cũng có thểđược sử dụng bởi bộ phận sản xuất để lên kế hoạch sản xuất, đồng thời có thểđược sử dụng bởi bộ phận tài chính để xác định giá trị tồn kho .v.v -Tin cậy : Thông tin mang tính tin cậy là thông tin có thể tin tưởng được. Trong nhiều trường hợp, độ tin cậy của thông tin phụ thuộc vào độ tin cậy của phương pháp thu thập thông tin hoặc phụ thuộc vào nguồn cung cấp thông tin. 2
  6. - Tính liên quan : Thông tin có ích chỉ khi nó liên quan đến sự việc cần xử lý. - Tính đơn giản : Thông tin cũng cần đơn giản, không được quá phức tạp. Các thông tin quá chi tiết và cầu kỳ nhiều khi không phải có ích. Trên thực tế, quá nhiều thông tin có thể gây quá tải, người ra quyết định có quá nhiều thông tin sẽ khó có khả năng xác định thông tin nào thực sự quan trọng. - Tính kịp thời : Thông tin kịp thời là thông tin được cung cấp khi cần thiết. Nhưng thông tin chậm trễ có thể trở thành vô tác dụng. -Có thể xác minh được : Thông tin cần có thể kiểm tra được để đảm bảo sựđúng đắn. -Có thể truy cập được : Thông tin cần đảm bảo có thể truy cập được bởi người dùng được phép, theo định dạng chuNn và đúng thời gian cần thiết. - An toàn : Thông tin cần được trong tình trạng an toàn, tránh khỏi những xâm phạm trái phép. Trong nhiều trường hợp, phụ thuộc vào loại thông tin cần thiết, một vài đặc điểm có thể có tầm quan trọng hơn các đặc điểm khác. Chẳng hạn, với các thông tin phân tích thị trường, một số dữ liệu chưa chính xác hoặc chưa hoàn thiện hoàn toàn có thể chấp nhận được, nhưng tính kịp thời của các thông tin này là quan trọng hơn. Các thành phần của hệ thống thông tin : Một cách tổng quát, hệ thống thông tin bao gồm 4 thành phần : Đầu vào (Input), Xử lý (Processing), Đầu ra (Output), Phản hồi (Feedback). Hình 1.2 Các thành phần của hệ thống thông tin Đầu vào : Những dữ liệu, thông tin cần thiết cho quá trình xử lý. Xử lý : Các thao tác biến đổi cần thiết trên dữ liệu đầu vào Đầu ra : Các kết quả của quá trình xử lý Phản hồi : Các hành động phát sinh trong quá trình xử lý, như lỗi hệ thống, thông báo .v.v. 3
  7. 1.2 Hệ thống thông tin dựa trên máy tính Hệ thống thông tin dựa trên máy tính (CBIS - Computer Based Information System) là một tập hợp các thành phần phần cứng, phần mềm, cơ sở dữ liệu (CSDL), phương tiện truyền thông, con người, quy trình được thiết lập để thu thập, xử lý, lưu trữ và biến đổi dữ liệu thành thông tin. Hệ thống xử lý đơn đặt hàng, hệ thống quản lý kho, hệ thống tính lương nhân viên .v.v là các ví dụ về CBIS. Hình 1.3 Các thành phần của CBIS Hình 1.3 mô tả các thành phần của 1 CBIS. -Phần cứng : Phần cứng của CBIS bao gồm các thiết bị, máy tính dùng để thực hiện các công việc nhập liệu, xử lý, và xuất dữ liệu đầu ra. -Phần mềm : Bao gồm các chương trình máy tính, điều khiển hoạt động của máy tính. Có 2 loại phần mềm chính là phần mềm hệ thống (chẳng hạn các hệđiều hành như Windows 7) dùng để điều khiển các hoạt động cơ bản của máy tính, và phần mềm ứng dụng (ví dụ Microsoft Office) cho phép người dùng thực hiện các công việc cụ thể. -Cơ sở dữ liệu : Là một tập hợp có tổ chức các sự kiện và thông tin, thường bao gồm một hoặc nhiều file dữ liệu có liên quan. 4
  8. - Con người : Nhân tố con người có thểđược coi là nhân tố quan trọng nhất trong hầu hết các hệ thống thông tin, bao gồm người quản lý, người sử dụng hệ thống, người duy trì hoạt động hệ thống v.v. - Quy trình : Bao gồm các chiến lược, chính sách, phương pháp, quy định trong việc sử dụng CBIS. -Mạng viễn thông, mạng máy tính, Internet : Khái niệm viễn thông chỉ sự truyền tải các tín hiệu dạng điện tử phục vụ cho quá trình truyền thông. Mạng máy tính chỉ việc kết nối các máy tính và các thiết bị khác trong một phạm vi nào đó, cho phép thực hiện truyền thông điện tử. Internet là một mạng máy tính có phạm vi toàn cầu, bao gồm hàng ngàn mạng kết nối với nhau, và có thể trao đổi thông tin một cách tự do. 1.3 Các hệ thống thông tin nghiệp vụ Các loại hệ thống thông tin hiện được sử dụng phổ biến nhất trong các tổ chức bao gồm các hệ thống thương mại điện tử, hệ thống xử lý giao dịch, hệ thống thông tin quản lý, hệ hỗ trợ quyết định. Ngoài ra, còn có một số loại hệ thống đặc biệt và được sử dụng chuyên biệt hơn như hệ thực tại ảo, hệ trí tuệ nhân tạo .v.v. Hệ thương mại điện tử (Electronic Commerce - E-Commerce) là các hệ thống cho phép thực hiện các giao dịch thương mại như mua bán các sản phNm và dịch vụ qua hệ thống mạng như Internet. Hình 1.4 TMĐT làm đơn giản hóa quá trình giao dịch 5
  9. Thương mại điện tử thường bao gồm các hình thức sau : - Business-to-business (B2B) : Giao dịch giữa các tổ chức/doanh nghiệp - Business-to-consumer (B2C): Giao dịch giữa doanh nghiệp và người tiêu dùng - Consumer-to-consumer (C2C): Giao dịch giữa người tiêu dùng với nhau Hệ thống xử lý giao dịch (Transaction Processing System - TPS) là hệ thống dùng để lưu trữ và xử lý các giao dịch nghiệp vụ hoàn thiện của tổ chức. Các hệ thống này thường liên quan đến các hoạt động thường nhật của tổ chức. Một tập các chương trình tích hợp có khả năng quản lý các hoạt động nghiệp vụ chính của tổ chức trên phạm vi toàn cục, tổng thể thì gọi là một hệ thống hoạch định tài nguyên doanh nghiệp (Enterprise Resource Planning). Hệ thống thông tin quản lý (Management Information System - MIS) là hệ thống thống tin dùng để phân tích các hệ thống thông tin khác được áp dụng trong các hoạt động nghiệp vụ của tổ chức. Nói cách khác, MIS là hệ thống thông tin có nhiệm vụ thu thập, xử lý, lưu trữ, phổ biến dữ liệu dưới dạng thông tin có ích, cần thiết để thực hiện các chức năng quản lý. Hình 1.5 Các hệ thống thông tin quản lý lấy dữ liệu từ các hệ thống xử lý giao dịch của tổ chức Hệ hỗ trợ quyết định (Decision Support System - DSS) là hệ thống dùng để hỗ trợ việc ra quyết định trong các vấn đề cụ thể. Một hệ thống DSS điển hình là một hệ thống có tính tương tác nhằm trợ giúp người ra quyết định trong việc rút ra được các thông tin có ích từ tập 6
  10. các dữ liệu thô, các tài liệu hoặc các tri thức cá nhân khác. Hệ DSS chú trọng vào việc làm tăng hiểu quả của việc ra quyết định. Hình 1.6 Các thành phần của hệ hỗ trợ quyết định Trí tuệ nhân tạo (Artificial Intelligent - AI) là trí tuệ của máy tính và một nhánh của ngành khoa học máy tính nhằm tạo ra nó. Các nghiên cứu về trí tuệ nhân tạo thường mang tính chuyên môn và đặc thù cao, được phân chia thành các lĩnh vực rất hẹp. Các loại hệ trí tuệ nhân tạo điển hình bao gồm: - Robotics: Khoa học về người máy, thiết kế, chế tạo, ứng dụng người máy, liên quan tới các lĩnh vực điện, cơ, phần mềm. -Hệ vision: Lĩnh vực khoa học nghiên cứu các loại máy có khả năng ‘’nhìn’’. Nói cách khác, hệ vision là các hệ thống có khả năng thu được thông tin từ các hình ảnh và ứng dụng trong các lĩnh vực nhưđiều khiển, nhận dạng vật thể, phát hiện sự việc, tổ chức thông tin (sắp xếp hình ảnh), tương tác người - máy .v.v. -Hệ xử lý ngôn ngữ tự nhiên: Là lĩnh vực liên quan đến việc chuyển đổi giữa ngôn ngữ con người và máy tính. Quá trình tạo ngôn ngữ tự nhiên là quá trình chuyển đổi từ dữ liệu máy tính sang ngôn ngữ con người. Quá trình hiểu ngôn ngữ tự nhiên là quá trình chuyển đổi các mẫu ngôn ngữ con người sang các dạng thức biểu diễn hình thức làm cho máy tính có thể xử lý dễ hơn. 7
  11. -Hệ học máy (machine learning): Học máy liên quan đến việc thiết kế và phát triển các thuật toán cho phép máy tính có thể thay đổi hành vi dựa trên dữ liệu có được. Mục đích của các nghiên cứu học máy là cho phép tựđộng phát hiện các mẫu phức tạp và ra các quyết định thông minh dựa trên dữ liệu. -Mạng nơ ron (neural networks): Mạng nơ ron tự nhiên là một hệ thống mạng các nơ ron sinh học, trong khi mạng nơ ron nhân tạo bao gồm các nơ ron hoặc các nút nhân tạo, là các đoạn chương trình phần mềm mô phỏng đặc điểm của nơ ron sinh học. -Hệ chuyên gia (expert system): Là các hệ thống phần mềm có thểđưa ra các câu trả lời cho một vấn đề hoặc làm rõ thêm các vấn đề chưa chắc chắn khi con người cần được tư vấn. Các hệ chuyên gia thường áp dụng trong một lĩnh vực hẹp cụ thể nào đó. Hình 1.7 Các hệ trí tuệ nhân tạo điển hình Hệ thực tại ảo (Virtual Reality) là công nghệ cho phép người dùng tương tác với một môi trường mô phỏng bằng máy tính, có thể là môi trường mô phỏng lại môi trường thực hoặc một môi trường nhân tạo hoàn toàn. Hầu hết các môi trường thực tại ảo hiện tại là các môi trường mô phỏng thị giác, tuy nhiên một vài môi trường cho phép tương tác qua một số giác quan khác. Người sử dụng có thể tương tác với môi trường thực tại ảo qua các thiết bị nhập chuNn như bàn phím, chuột, hoặc qua các thiết bịđặc biệt như Head-mounted-display (HMD), data loves .v.v. HMD là một thiết bị bao gồm hai màn hình hiển thị nhỏ và 1 hệ thống quang học. Hai thành phần này sẽ chuyển các hình ảnh từ màn hình vào mắt, biểu thị nên các hình ảnh nổi, 3 chiều. 8
  12. Hình 1.8 Head Mounted Display Data glove là một thiết bị nhập có dạng găng tay, trong đó các công nghệ cảm ứng được sử dụng để thu thập dữ liệu vật lý chẳng hạn các chuyển động từ các khớp ngón tay. Thông thường, một bộ phận theo dõi chuyển động được gắn vào data glove để thu thập dữ liệu vị trí và độ xoay của data glove. Các chuyển động này được phiên dịch bởi một phần mềm gắn với data glove, nhờ vậy mỗi chuyển động có thểứng với một vài ý nghĩa nào đó. Một số loại data glove cao cấp có khả năng cung cấp phản ứng xúc giác mô phỏng cảm giác sờ. Khả năng này cho phép data glove đồng thời đóng vai trò là thiết bị xuất. Hình 1.9 Data Glove 9
  13. 1.4 Hệ thống thông tin và các tổ chức Mô hình chung của một tổ chức: Mỗi tổ chức có một mô hình hoạt động riêng, tuy nhiên về mặt tổng quan thì một tổ chức có mô hình như sau: Hình 1.10 Mô hình chung của các tổ chức Trong mô hình này, các hoạt động của tổ chức nằm ở 3 khối: Input, Processing, Output. Luồng vật liệu đi từ Input->Processing->Output thể hiện quá trình nhập, xử lý, và xuất. Các hoạt động này được thực hiện thông qua việc ra các quyết định của người làm thể hiện qua luồng quyết định, và đi cùng với nó là luồng dữ liệu. Luồng giá trịđi từ trái qua phải, theo đó sản phNm có giá trị tăng dần lên. Khái niệm chuỗi giá trị (value chain): Chuỗi giá trị là một khái niệm trong quản lý kinh doanh được đưa ra bởi GS. Michael Porter trong cuốn sách best-seller năm 1985 về Lợi thế cạnh tranh (Competitive Advantage). Chuỗi giá trị là một chuỗi các hoạt động. Trong sản xuất, sản phNm sẽđược đi qua tất cả các hoạt động trong chuỗi theo một thứ tự, và tại mỗi hoạt động, sản phNm sẽ gia tăng thêm một giá trị nào đó. Chuỗi các hoạt động sẽ làm cho sản phNm có giá trị gia tăng lớn sơn so với tổng giá trị gia tăng của từng hoạt động, qua đó tạo ra lợi nhuận. Một lưu ý quan trọng là không nên nhầm lẫn giữa khái niệm chuỗi giá trị với các chi phí trong các chuỗi các hoạt động. Chẳng hạn trong hành động gọt kim cương, hoạt động gọt có thể có chi phí thấp, nhưng nó làm gia tăng giá trị của sản phNm cuối cùng lên rất nhiều. 10
  14. Trong chuỗi giá trị, các hoạt động chính bao gồm: vận chuyển vào, sản xuất (xử lý), vận chuyển ra, marketing và bán hàng (sales), chăm sóc khách hàng (customer service). Các hoạt động hỗ trợ bao gồm: hệ thống quản trị - hành chính, nhân sự, nghiên cứu phát triển .v.v. Hình 1.11 Chuỗi giá trị trong doanh nghiệp sản xuất Có thể thấy rằng, lợi nhuận của doanh nghiệp phụ thuộc vào tính hiệu quả trong việc thực hiện các hoạt động trong chuỗi giá trị. Để tăng tính hiệu quả của các hoạt động này thì việc áp dụng các hệ thống thông tin, áp dụng công nghệ là một trong những yếu tố then chốt. Các hệ thống thông tin có thểđược áp dụng trong hầu hết các hoạt động của chuỗi giá trị, kể cả trong các hoạt động chính cũng như các hoạt động hỗ trợ. Lợi thế cạnh tranh (competitive advantage): Lợi thế cạnh tranh được định nghĩa là một lợi thế quan trọng và lâu dài của doanh nghiệp trước các đối thủ cạnh tranh. Giữ vững lợi thế cạnh tranh là yếu tố then chốt để duy trì lợi nhuận của doanh nghiệp. Các yếu tố sau đây khiến cho doanh nghiệp phải tìm kiếm được lợi thế cạnh tranh: -Sự ganh đua giữa các đối thủ hiện tại -Sựđe dọa từ một đối thủ mới -Sựđe dọa từ các sản phNm và dịch vụ thay thế -Sức mạnh thương lượng của khách hàng và nhà cung cấp Theo Michael Porter, có 2 loại lợi thế cạnh tranh: 11
  15. -Lợi thế về giá (cost advantage): Khả năng cung cấp sản phNm cùng loại nhưng giá rẻ hơn -Lợi thế về sự khác biệt (diffirentiation advantage): Khả năng cung cấp sản phNn cùng giá nhưng có đặc điểm khác biệt (tốt hơn) Để tạo ra được lợi thế cạnh tranh, doanh nghiệp cần lập các kế hoạch chiến lược theo các định hướng: -Thay thế cấu trúc và quy trình nghiệp vụ -Tạo ra các sản phNm và dịch vụ mới -Cải tiến các dòng sản phNm và dịch vụ hiện tại -Sử dụng các hệ thống thông tin cho các mục đích chiến lược Hệ thống thông tin dựa trên hiệu suất: Hầu hết các doanh nghiệp đều trải qua 3 giai đoạn trong quá trình sử dụng hệ thống thông tin. Trong giai đoạn đầu tiên, các tổ chức chú trọng vào sử dụng hệ thống thông tin để làm giảm giá thành và tăng năng suất. Ở giai đoạn này tổ chức thường không chú trọng vào việc sử dụng hệ thống thông tin để làm tăng doanh thu hoặc phục vụ cho hoạt động bán hàng. Trong giai đoạn 2, các hệ thống thông tin được sử dụng để hướng vào việc tạo ra lợi thế cạnh tranh cho tổ chức. Khi đó, các hệ thống thông tin có thểđược xây dựng với một chi phí lớn và giá cả không phải là vấn đề cần cân nhắc nhiều. Tuy nhiên, ở giai đoạn 3, các tổ chức chú ý đến việc quản lý dựa trên hiệu suất của hệ thống thông tin. Nói cách khác, việc sử dụng hệ thống thông tin được cân nhắc kỹ lưỡng trên các lợi thế chiến lược và chi phí xây dựng và vận hành hệ thống, dựa trên các tham số như hiệu suất, tỷ suất lợi nhuận trên vốn đầu tư, giá trị của hệ thống thông tin .v.v. Hiệu suất là phép đo được tính bằng kết quảđạt được chia cho đầu vào. Với cùng một đầu vào, kết quả đầu ra tốt hơn chứng tỏ hiệu suất cao hơn. Tỷ suất lợi nhuận là một phép đo giá trị của hệ thống thông tin. Phép đo này khảo sát tỷ lệ giá trị lợi nhuận gia tăng được tạo ra trên giá trị đầu tư phát triển hệ thống thông tin. Ngoài ra, còn một số tham số khác để đánh giá giá trị của hệ thống thông tin như tăng trưởng lợi nhuận của doanh nghiệp, gia tăng thị phần, gia tăng sự nhận biết và hài lòng của khách hàng .v.v 12
  16. Hình 1.12 Ba giai đoạn trong quá trình sử dụng hệ thống thông tin Vai trò, chức năng của các vị trí trong phát triển và vận hành hệ thống thông tin: Để phát triển và vận hành các hệ thống thông tin trong các tổ chức, cần có một bộ phận chuyên biệt với các vai trò và chức năng của từng vị trí theo các lĩnh vực: - Phát triển hệ thống -Vận hành hệ thống -Hỗ trợ Mô hình và các mối liên quan của các vị trí cụ thểđược mô tả như trong hình 1.13, trong đó có các vị trí điển hình như: - Chief Information Officer (CIO): Giám đốc Công nghệ - LAN Administrators: Quản trị hệ thống LAN 13
  17. - Các vị trí công việc liên quan đến Internet. Hình 1.13 Ba chức năng chính trong phát triển và vận hành hệ thống thông tin 14
  18. CHƯƠNG 2 PHẦN CỨNG VÀ PHẦN MỀM CỦA HỆ THỐNG THÔNG TIN Chương này trình bày về các thành phần phần cứng và phần mềm của hệ thống thông tin dựa trên máy tính. Đối với các hệ thống thông tin dựa trên máy tính, người sử dụng hệ thống thông tin phải làm việc với những chuyên gia phát triển hệ thống để định nghĩa các yêu cầu nghiệp vụ, đánh giá các tùy chọn, và chọn lựa các thành phần phần cứng, phần mềm để cung cấp một giải pháp hiệu quả và phù hợp với yêu cầu đặt ra. Phần đầu của chương sẽ trình bày các vấn đề sau: -Chỉ ra và đánh giá vai trò của các thành phần phần cứng cốt lõi của một hệ thống máy tính -Liệt kê các loại máy tính phổ biến và vai trò của chúng -Chỉ ra vai trò của hệđiều hành và sự phát triển của hệđiều hành -Chỉ ra và mô tả các chức năng của hai loại phần mềm cơ bản Đối với các phần mềm ứng dụng, các tổ chức chỉ phát triển các phần mềm ứng dụng độc quyền khi nó có thể giúp cho doanh nghiệp đáp ứng các yêu cầu nghiệp vụ bắt buộc để đạt được các lợi thế cạnh tranh và để phát triển các phần mềm, những chuyên gia phát triển hệ thống thường sử dụng các ngôn ngữ lập trình có đặc điểm chức năng phù hợp với vấn đề cần giải quyết. Phần cuối của chương sẽ trình bày về các phương pháp tiếp cận trong phát triển phần mềm ứng dụng cũng như các ngôn ngữ lập trình được sử dụng và sự phát triển của các thế hệ ngôn ngữ lập trình. 2.1 Phần cứng Phần cứng được định nghĩa là bất kỳ thiết bị máy móc nào (hầu hết sử dụng các mạch số) hỗ trợ cho các hoạt động nhập liệu đầu vào, xử lý, lưu trữ, và xuất ra kết quảđầu ra của hệ thống thông tin. Khi lựa chọn phần cứng nên cân nhắc việc các phần cứng này có thể hỗ trợ các mục đích của HTTT và mục tiêu của tổ chức như thế nào. Để xây dựng nên 1 hệ thống phần cứng hiệu quả, cần phải lựa chọn và tổ chức các thành phần dưới góc độ cân đối giữa các vấn đề hiệu năng tổng thể của hệ thống, giá cả, độ phức tạp và khả năng điều hành hệ thống. Nhu cầu về nghiệp vụ của mỗi tổ chức là khác nhau, do vậy các giải pháp về HTTT có thểđược lựa chọn khác nhau. Để lựa chọn các hệ thống phần cứng đúng đắn, cần nắm được mối quan hệ giữa chúng với HTTT và nhu cầu của tổ chức. 15
  19. 2.1.1 Các thành phần phần cứng của hệ thống máy tính Các thành phần phần cứng của hệ thống máy tính bao gồm các thiết bị thực hiện các chức năng nhập liệu đầu vào, xử lý, lưu trữ, và xuất dữ liệu đầu ra, cùng với các hệ thống thiết bị lưu trữ phụ dùng để lưu trữ các dữ liệu có tính lâu dài và thiết bị truyền thông dùng để kết nối các hệ thống máy tính. Hình 2.1 Các thành phần phần cứng của hệ thống máy tính Tất cả các hoạt động xử lý của máy tính được thực hiện bởi Bộ xử lý trung tâm (Central Processing Unit - CPU). CPU bao gồm 2 thành phần chính : ALU - Arithmetic and Logic Unit và CU - Control Unit. ALU thực hiện các phép tính toán học và các phép so sánh logic. CU thực hiện truy cập tuần tự vào các lệnh của chương trình, giải mã, phối hợp các luồng dữ liệu vào/ra ALU, bộ nhớ chính, bộ nhớ phụ và các thiết bị ra khác. Bộ nhớ chính, nơi lưu trữ các lệnh của chương trình và dữ liệu, được kết nối chặt chẽ với CPU. 2.1.2 Thực hiện lệnh Thao tác cơ bản nhất của các bộ xử lý là thực hiện chuỗi tuần tự các lệnh (gọi là một chương trình được lưu trong bộ nhớ chính). Mỗi lệnh chương trình được máy tính thực hiện theo 2 giai đoạn: - Instruction Phase: Bao gồm 3 bước là nạp lệnh và giải mã lênh - Excution Phase: Gồm 3 bước thực thi lệnh và lưu kết quả 16
  20. Hình 2.2 Thực hiện một lệnh 2.1.3 Thiết bị xử lý Khả năng xử lý dữ liệu là khía cạnh tối quan trọng của 1 hệ thống máy tính, trong đó việc xử lý được thực hiện bởi sự trao đổi qua lại giữa bộ xử lý trung tâm và thiết bị lưu trữ như chu trình ở hình 2.2. Machine Cycle Time Tốc độ xử lý của CPU được đặc trưng bởi thời gian xử lý một lệnh, còn gọi là machine cycle time hay instruction cycle time, bao gồm 2 giai đoạn và 4 bước như mô tảở trên. Thời gian này rất nhỏ và thường được đo bằng nano second (một phần tỷ giây) hoặc thậm chí pico second (một phần nghìn tỷ giây). Ngoài ra tốc độ xử lý còn được đo bằng đơn vị triệu phép tính/giây (MIPS - Million Instruction Per Second). Một số bộ xử lý có khả năng thực hiện xử lý theo kiểu “gối” các lệnh (pipeline), có nghĩa là có thể xử lý nhiều lệnh trong cùng 1 vòng xử lý, chẳng hạn trong lúc thực thi 1 lệnh, nó có thể giải mã một lệnh khác, đồng thời nạp 1 lệnh khác nữa .v.v. Clock Speed Mỗi bộ xử lý tạo ra một chuỗi các xung điện với một tốc độ định trước, gọi là tốc độ đồng hồ (clock speed), có ảnh hưởng tới tốc độ thực hiện lệnh như nói ở trên. Mỗi lệnh khi đưa vào CPU thực hiện sẽđược phân rã thành các thao tác mức sơ cấp, được định nghĩa trước, và khối điều khiển CU của bộ xử lý thực hiện các thao tác này theo các nhịp xung điện của đồng hồ CPU. Mỗi thao tác cần ít nhất khoảng thời gian giữa hai xung nhịp để thực hiện. Thời gian giữa hai xung nhịp càng ngắn, thời gian thực hiện thao tác càng nhanh. Do số các thao tác sơ cấp cần thiết để thực hiện một lệnh chương trình có thể khác nhau, tốc độ đồng hồ không dùng để đo tốc độ xử lý thật của máy tính. Tốc độ đồng hồ thường được 17
  21. đo bằng MHz (triệu xung trên giây), hoặc GHz (tỷ xung trên giây). Một vấn đề nữa là tốc độ đồng hồ càng cao thì nhiệt sản sinh ra càng lớn, và nhiệt này cần được tản đi để tránh ảnh hưởng tới dữ liệu cũng như việc xử lý của CPU. Do đó, một CPU có tốc độ càng cao thì cần các thiết bị tản nhiệt càng lớn, dẫn đến tăng kích thước của máy tính. Đây là vấn đề đối với các nhà sản xuất máy tính xách tay, nếu muốn sản xuất các máy tính tốc độ cao nhưng kích thước nhỏ gọn. Các đặc điểm vật lý của CPU Hầu hết các bộ xử lý bao gồm các mạch sốđược in lên một miếng silicon, hay còn gọi là chip. Để bật hoặc tắt một mạch số trên CPU, dòng điện phải truyền qua một phương tiện (thường là silicon) từđiểm A tới điểm B. Thời gian truyền giữa các điểm có thể giảm bằng cách làm giảm khoảng cách giữa các điểm hoặc làm giảm điện trở của phương tiện truyền. Việc giảm khoảng cách giữa các điểm làm cho các chip trở nên nhỏ hơn. Vào đầu những năm 1960s, sau khi sáng chế ra mạch tích hợp, Gordon Moore, cự chủ tịch tập đoàn sản xuất chip lớn nhất thế giới, Intel, phát biểu rằng trong tiến trình phát triển của việc sản xuất chip, các nhà sản xuất có khả năng cải tiến để có thể tăng gấp đôi số lượng bóng bán dẫn (transistor - loại công tắc on/off siêu nhỏ) trên một chip cứ mỗi hai năm. Và phát biểu này trở thành định luật Moore nổi tiếng - mật độ bóng bán dẫn trên một chip tăng lên gấp đôi sau 2 năm. Hình 2.3 Định luật Moore 2.1.4 Thiết bị nhớ Được định vịở vị trí rất gần với CPU, nhằm giảm thời gian truy cập. Chức năng chính của bộ nhớ là cung cấp nhanh chóng các lệnh chương trình và dữ liệu cho CPU. 18
  22. Dung lượng lưu trữ Giống CPU, thiết bị nhớ bao gồm hàng nghìn mạch được in trên tấm chip silicon. Mỗi mạch biểu thị trạng thái dẫn điện (on) hoặc không dẫn điện (off). Dữ liệu được chứa trong bộ nhớ thông qua sự kết hợp của các trạng thái mạch on/off này. Đơn vị nhớ nhỏ nhất là bit. 8 bits hình thành 1 byte, thường được dùng để biểu diễn một ký tự (chẳng hạn chữ A). Ngoài ra còn các đơn vị cao hơn như MB, GB, TB .v.v. Các loại bộ nhớ Bộ nhớ máy tính có thểđược phân chia thành một số loại. Loại bộ nhớ phổ biến, dùng để lưu trữ tạm thời các lệnh chương trình và dữ liệu được gọi là RAM (Random Access Memory). Đây là bộ nhớ dạng volatile, có nghĩa là nội dung của nó sẽ bị mất khi ngắt dòng điện. RAM được gắn trực tiếp vào bo mạch chủ của máy tính hoặc trên một card ngoại vi khác gắn trên bo mạch. RAM lại được chia thành một số loại khác nhau. SRAM (Static RAM) là loại RAM sử dụng tới 6 transistor cho một ô nhớ, và do vậy không cần phải làm tươi định kỳ, được sử dụng cho bộ nhớđệm (cache) và thanh ghi tốc độ cao. Ngược lại, DRAM (Dynamic RAM) là loại RAM chỉ dùng một transistor và 1 tụđiện (capacitor) cho một ô nhớ, do vậy DRAM có mật độ rất cao so với SRAM. Tuy nhiên, do tụđiện sẽ bị hao điện năng trong quá trình hoạt động, do vậy DRAM phải được làm tươi định kỳđể bù điện. DRAM lại có một số loại như: EDO RAM (Extended Data Output RAM) là loại RAM có thể cho phép một số thao tác chồng nhau một phần (pipelining), SDRAM (Synchronous DRAM) là loại RAM có giao diện đồng bộ, có nghĩa là nó sẽ chờ tín hiệu đồng hồ trước khi đáp ứng các đầu vào điều khiển, do vậy có thể đồng bộ với bus hệ thống của máy tính, DDR DRAM (Double Data Rate DRAM) là loại RAM có thể làm tăng tốc độ gần gấp đôi so với SDR DRAM (Single Data Rate) bằng cách truyền dữ liệu trên cả 2 nửa chu kỳ lên/xuống của tín hiệu đồng hồ. Trong khi RAM là loại bộ nhớ volatile thì ROM (Read-Only Memory) là bộ nhớ non- volatile, có nghĩa là nội dung của nó sẽ không bị mất khi ngắt nguồn điện. ROM dùng để lưu trữ vĩnh viễn những dữ liệu và lệnh chương trình không thay đổi, chẳng hạn các dữ liệu và chương trình từ nhà sản xuất, điển hình là ROM BIOS chứa các chương trình để máy tính khởi động khi bật nguồn. Ngoài loại ROM thông thường chứa các chương trình đã cứng hóa và không thể thay đổi, còn một số loại ROM khác như PROM (Programmable ROM) là loại có thể lập trình được, có thểđược ghi 1 lần sau khi sản xuất, và EPROM (Erasable PROM) là loại ROM có thể xóa đi ghi lại nhiều lần (bằng các thiết bị hoặc chương trình chuyên dụng). 19
  23. Hình 2.4 Các loại bộ nhớ 2.1.5 Thiết bị lưu trữ phụ Nhưđã nói ở trên, thiết bị nhớ chính là nhân tố quan trọng xác định sức mạnh của hệ thống máy tính. Tuy nhiên, bộ nhớ chính chỉ cung cấp một dung lượng nhỏ dành cho dữ liệu và các lệnh cần thiết để CPU xử lý. Máy tính cần có 1 bộ nhớ khác để chứa dữ liệu, chương trình, thông tin nhiều hơn và lâu dài hơn. Đó chính là thiết bị nhớ phụ. Ưu điểm của thiết bị nhớ phụ là không bị mất dữ liệu khi ngắt điện, dung lượng lớn hơn nhiều, giá cả thấp hơn nhiều. Tuy nhiên, tốc độ truy cập thì thấp hơn đáng kể. Việc lựa chọn thiết bị nhớ phụ phù hợp, đòi hỏi phải có hiểu biết về các đặc điểm như phương pháp truy cập, dung lượng, tính di động của thiết bị. Phương pháp truy cập Có hai phương pháp truy cập được sử dụng phổ biến là truy cập tuần tự và truy cập trực tiếp. Truy cập tuần tự (sequencetial access) là phương pháp truy cập trong đó một nhóm các đối tượng (dữ liệu trong các ô nhớ, trong đĩa hoặc băng ) được truy cập theo một thứ tự xác định trước (thường chính là thứ tự mà các đối tượng được lưu trữ trước đó). Đối với một số thiết bị, truy cập tuần tự là phương pháp duy nhất để truy cập đến các đối tượng (chẳng hạn trong các băng từ sẽ xem xét ở phần sau), hoặc có thể là một phương pháp tùy chọn. Truy cập trực tiếp (direct access), đôi khi còn được gọi là truy cập ngẫu nhiên (random access), là phương pháp truy cập có khả năng truy cập tới một đối tượng bất kỳ trong danh sách với thời gian truy cập như nhau, nghĩa là có thể truy cập trực tiếp vào đối tượng dữ liệu 20
  24. mong muốn mà không phải lần lượt qua các đối tượng trước đó. Tính chất này đối ngược với truy cập tuần tự, trong đó đối tượng ở vị trí xa hơn có thời gian truy cập lâu hơn. Các loại thiết bị lưu trữ phụ Các thiết bị lưu trữ phụđược sử dụng hiện nay rất đa dạng, sau đây là một số loại thiết bị phổ biến: -Băng từ (magnetic tapes): Là loại thiết bị lưu trữ lâu đời nhất, thuộc loại truy cập tuần tự (là phương pháp truy cập duy nhất) và hiện nay được sử dụng chủ yếu trong việc sao lưu dự phòng dữ liệu. Tương tự như các loại băng video hoặc băng cassette, băng từ là một dải film được phủ một lớp oxit sắt. Các phần của băng được từ hóa để biểu thị các bits. Nếu máy tính muốn đọc dữ liệu ở vị trí giữa của cuộn băng, nó phải lần lượt qua tất cả các vị trí nằm phía trước vị trí cần lấy dữ liệu, đây là nhược điểm của băng từ. Để lấy dữ liệu, nó cần dịch chuyển băng đến đúng vị trí và gắn vào đầu đọc băng để đọc dữ liệu ra máy tính. Ngày nay, băng từ không còn được sử dụng rộng rãi, nhưng vẫn còn được sử dụng như một thiết bị lưu trữ dự phòng giá rẻ. Ngoài ra, công nghệ phát triển hơn cho phép sản xuất các loại bằng từ tốc độ cao, dung lượng lớn, và kích thước film rất nhỏ, tiện lợi cho việc bảo quản. Hình 2.5 Băng từ - Đĩa từ (magnetic disks): Đĩa từ cũng là loại được bao phủ bằng chất oxit sắt, có thể là một đĩa kim loại mỏng (đĩa cứng) hoặc một tấm film tròn (đĩa mềm). Và tương tự băng từ, đĩa từ biểu thị các bits bằng các vùng đĩa được từ hóa. Khi đọc hoặc ghi dữ liệu lên đĩa, đầu đọc đĩa dịch chuyển thẳng đến vùng mong muốn trên đĩa để đọc hoặc ghi. Do vậy, đĩa từ là loại thiết bị truy cập trực tiếp, có tốc độ truy cập nhanh hơn nhiều so với băng từ. Có một số loại đĩa từ khác nhau, cả về dung lượng và tính di động. 21
  25. Các loại đĩa từ di động nhưđĩa mềm hoặc đĩa Zip ngày này gần như không còn được sử dụng nữa. Các đĩa cứng mặc dù có giá cao hơn và không di chuyển linh hoạt được, nhưng được sử dụng rộng rãi do có dung lượng lớn hơn nhiều và tốc độ cũng nhanh hơn. Hình 2.6 Đĩa cứng - RAID (Redundant Array of Independent Disks) Việc lưu trữ dữ liệu trong các đĩa từ không phải lúc nào cũng an toàn. Các thiết bị này có thể bị hỏng bất cứ lúc nào, hoặc dữ liệu được lưu có thể bịảnh hưởng bởi các yếu tố khác bên ngoài do chúng được lưu thông qua việc từ hóa các vùng đĩa. Do vậy, nhu cầu về các thiết bị lưu trữ có thể chống lỗi là cấp thiết. RAID là một phương pháp lưu trữ dữ liệu sử dụng kỹ thuật lưu trữ thêm các thông tin điều khiển, cho phép hệ thống tạo ra các “bản đổ xây dựng lại” để khi nếu một đĩa cứng bị hỏng có thể tái tạo lại dữ liệu bằng cách thay vào đĩa mới và tiến hành khôi phục lại dữ liệu ban đầu. Để làm được việc này, dữ liệu được chia ra thành nhiều phần và lưu trữ song song trên các đĩa cứng vật lý khác nhau sử dụng công nghệ striping để phân tán dữ liệu. Công nghệ này có khả năng làm tăng hiệu suất và độ tin cậy của hệ thống. RAID có thểđược thực thi theo một số phương pháp. Đơn giản nhất là dùng phương pháp đĩa bản sao (disk mirror), theo đó hệ thống sẽ ghi dữ liệu lặp 2 lần giống hệt nhau lên 2 đĩa khác nhau. Như vậy, phương pháp này cần gấp đôi dung lượng cần có, và là phương pháp tốn kém. Một số phương pháp RAID khác phức tạp hơn, nhưng hiệu quả hơn vì chỉ ghi đúp một phần của dữ liệu. 22
  26. Để sử dụng RAID cần có các phần cứng và phần mềm chuyên dụng. Thiết bị phần cứng RAID thường được thiết kếđể biểu thị các đĩa RAID trong hệ thống như là một đĩa đơn duy nhất, và hệđiều hành không hề nhận ra đây là nhiều đĩa kết hợp với nhau. Các giải pháp phần mềm thường được cài đặt trên hệđiều hành, và biểu thị các đĩa RAID như một đĩa đơn duy nhất đối với các ứng dụng chạy trên hệđiều hành đó. Hình 2.7 RAID - SAN (Storage Area Network) SAN là một kỹ thuật dùng để gắn các thiết bị lưu trữ phụ (băng từ, đĩa từ, đĩa quang ) vào các máy tính từ xa nhưng theo phương thức làm cho các thiết bị này nhưđược gắn trực tiếp vào các máy tính. Hình 2.7 Storage Area Network 23
  27. - Đĩa quang (CD - Compact Disk) Đĩa quang là một loại thiết bị lưu trữ có cấu tạo là một đĩa tròn phẳng, chứa dữ liệu được mã hóa bằng các hốc siêu nhỏ trên một chất liệu đặc biệt (thường làm bằng nhôm) được phủ trên một trong 2 mặt của đĩa. Dữ liệu được ghi lên đĩa bằng cách sử dụng tia laser, và sau đó có thểđược truy cập khi vùng dữ liệu được chiếu sáng bởi một diode laser nằm trong ổđĩa quang. Sự khác nhau vềđộ cao giữa các hốc và mặt phẳng sẽ dẫn đến sự khác nhau về cường độ của tia sáng phản xạ, và dữ liệu được đọc thông qua việc đo sự thay đổi cường độ phản xạ này. Đĩa quang ghi được (CD Recordable - CD-R) lại sử dụng một loại sơn nhạy cảm với ánh sáng để phủ lên mặt đĩa. Tia laser của ổ ghi CD sẽ làm đổi màu sơn và cho phép tia laser của ổđọc CD có thểđọc được dữ liệu. Các loại đĩa này chỉ ghi được 1 lần. Đĩa CD đọc ghi nhiều lần (CD ReWritable - CD-RW) sử dụng hợp kim thay vì sơn. Tia laser của ổ ghi trong trường hợp này dùng để đốt nóng và làm thay đổi tính chất của hợp kim (chẳng hạn tính chất kết tinh hoặc không kết tinh), qua đó làm thay đổi đặc điểm phản xạ của vùng hợp kim bịđốt. Đĩa CD-RW không có được sự khác biệt nhiều về phản xạ như các đĩa CD hoặc CD-R, do vậy, nhiều đĩa CD-RW không đọc được bởi các ổđĩa CD loại cũ. - Đĩa từ quang (magneto-optical disk) Là một loại đĩa quang được đọc và ghi bởi ổđĩa từ quang. Đặc điểm của loại đĩa này là mặc dù là đĩa quang nhưng lại được xem như là đĩa cứng đối với hệđiều hành và không cần phải sử dụng hệ thống file đặc biệt. - Đĩa DVD (Digital Versatile Disk) Cũng là một loại đĩa quang, được phát minh vào năm 1995, có kích thước tương tự CD nhưng có dung lượng lưu trữ dữ liệu lớn hơn gấp khoảng 6 lần nhờ công nghệ tạo ra các hốc nhỏ hơn nhiều so với CD. -Thẻ nhớ (Memory cards) Là một loại thiết bị lưu trữ non-volatile, có thể xóa đi và ghi lại nhiều lần. Đây là một loại EEPROM có thể xóa và ghi theo từng khối lớn. - Các thiết bị lưu trữ mở rộng Bao gồm các thiết bị di động nhưổ cứng rời, ổ Zip .v.v. 2.1.6 Thiết bị nhập Là các thiết bịđóng vai trò cổng nối tới máy tính, được sử dụng để cung cấp dữ liệu và 24
  28. lệnh chương trình cho máy tính. Có rất nhiều các thiết bị nhập, từ các thiết bị có mục đích đặc biệt để thu thập các loại dữ liệu đặc biệt cho đến các thiết bị phổ thông hơn. Thiết bị nhập dữ liệu cá nhân Bàn phím và chuột là các thiết bị nhập thông dụng nhất, được dùng để đưa các dữ liệu như các ký tự, văn bản, lệnh cơ bản vào máy tính. Hiện nay nhiều bàn phím và chuột có những thiết kếđặc biệt hơn để tiện lợi trong sử dụng cũng như nhập dữ liệu nhanh hơn. Chuột được dùng để trỏ và nhấn vào các biểu tượng, menu, lệnh trên màn hình, máy tính sẽ thực hiện 1 số các phản ứng theo đó. Thiết bị nhận dạng tiếng nói Công nghệ nhận dạng tiếng nói cho phép một máy tính có trang bị các thiết bị thu âm như mic có thể chuyển đổi tiếng nói của con người thành một phương tiện cung cấp dữ liệu hoặc lệnh cho máy tính. Hầu hết các hệ thống cần được luyện để nhận dạng các mẫu hoặc bị giới hạn trong 1 phạm vi hẹp số từ vựng có thể nhận dạng. Các hệ thống tiên tiến hơn có thể nhận dạng các chuỗi tiếng nói liên tục mà không cần phải chia nhỏ ra thành các từ rời rạc. Các hệ thống cao cấp hiện nay cho phép nhận dạng các âm thanh chưa từng nghe và có thể hiểu được các từ vựng phức tạp. Một số tổ chức, doanh nghiệp đã xây dựng các hệ thống nhận dạng tiếng nói và trả lời tự động thay vì sử dụng con người, hầu hết trong các trường hợp yêu cầu của người dùng không quá phức tạp. Máy ghi hình kỹ thuật số Là các thiết bị dùng để ghi lại, và lưu trữ các hình ảnh và video dưới dạng kỹ thuật số. Màn hình cảm ứng Các công nghệ màn hình mới cho phép màn hình hiển thị vừa là thiết bị nhập vừa là thiết bị xuất. Bằng cách chạm vào các vùng nhất định trên màn hình cảm ứng, người dùng có thể thực thi các lệnh, chương trình, hoặc làm cho máy tính có các đáp ứng nào đó. Máy quyét Là các thiết bị dùng để số hóa dữ liệu và đưa vào máy tính. 25
  29. 2.1.7 Thiết bị xuất Các hệ thống máy tính xuất ra dữ liệu đầu ra là kết quả của quá trình xử lý cho những người ra quyết định ở mọi cấp độ của tổ chức để họ có thể giải quyết các vấn đề nghiệp vụ. Ngoài ra, đầu ra của hệ thống này có thể là đầu vào của hệ thống khác. Các dạng thức đầu ra có thể là dạng trực quan, âm thanh, hoặc thậm chí dạng số. Với bất kỳ nội dung hay dạng thức nào của đầu ra, các thiết bị xuất cần được thiết kếđể cung cấp đúng thông tin tới đúng người cần thiết với đúng dạng thức và tại đúng thời điểm. Màn hình hiển thị Màn hình hiển thị là thiết bị giống như màn hình TV, trên đó các dữ liệu đầu ra từ máy tính sẽđược hiển thị. Các màn hình truyền thống sử dụng ống phóng tia âm cực để hiển thị hình ảnh, do vậy nó còn được gọi là màn hình CRT (Cathode Ray Tube). Các màn hình này có cơ chế hoạt động gần giống như TV - có các dòng điện tử phóng ra từ các ống phóng. Các tia này bắn vào hỗn hợp phốt pho được trát lên bề mặt màn hình, một điểm trên màn hình gọi là điểm ảnh sẽ sáng lên. Các tia này quét đi quét lại trên màn hình, do đó khi ánh sáng phốt pho mờđi thì nó lại bắn tiếp và điểm ảnh lại sáng lên. Chất lượng màn hình được đo bằng sốđiểm ảnh ngang và dọc dùng để tạo ra nó. Mật độ điểm ảnh càng dày thì độ phân giải càng lớn, độ rõ và sắc nét của hình ảnh càng tốt hơn. Khoảng cách giữa 2 điểm ảnh kề nhau gọi là khoảng cách điểm. Khoảng cách này thông thường từ 0.25 đên 0.31mm. Khoảng cách điểm càng nhỏ thì chất lượng hình ảnh càng tốt. Đặc điểm của màn hình màu phụ thuộc vào chất lượng màn hình, dung lượng RAM và bộ giao diện màn hình (Graphic Card). Màn hình tinh thể lỏng Màn hình LCD (Liquid Crystal Display) hiển thị các hình ảnh sử dụng tinh thể lỏng, một chất liệu giống như dầu, được đặt giữa 2 tấm kính phân cực, để hình thành các ký tự và hình ảnh trên màn hình. Loại màn hình này đỡ hại mắt người sử dụng vì nó ít nhấp nháy, sáng hơn, và không phát ra các tia sóng làm người sử dụng màn hình CTR lo ngại. Hơn nữa, màn hình LCD mỏng hơn, chiếm ít diện tích và tiêu thụ ít điện năng hơn. Màn hình TFT LCD (thin-film transistor) là loại màn hình tinh thể lỏng gắn một transistor để điều khiển 1 pixel, do vậy, độ phân giải cao hơn và phản ứng nhanh hơn với những thay đổi trên màn hình. Máy in và máy vẽ Là các thiết bị cho đầu ra bản cứng (hard copy). Có nhiều loại máy in với các tốc độ, đặc điểm và khả năng khác nhau. Tốc độ máy in được đo bằng số trang in trên phút (pages per minute - ppm). Về chất lượng in, tương tựđộ phân giải màn hình, chất lượng in dựa trên số 26
  30. lượng điểm in trên mỗi inch (dot per inch - dpi). Máy in có dpi càng lớn thì chất lượng càng cao. Các công nghệ in được áp dụng bao gồm in kim, in phun và in laser (phổ biến nhất hiện nay). Máy vẽ là các thiết bị xuất bản cứng được dùng trong công việc thiết kế. Chúng thường được dùng để tạo ra các sơđồ, bản vẽ thiết kế tòa nhà, thiết kế sản phNm 2.1.8 Các loại máy tính Có nhiều loại máy tính, được sử dụng theo các mục đích và nhu cầu khác nhau. - Handheld: Máy tính cầm tay - Notebook, Laptop: Máy tính xách tay - Network Computer: Máy tính được thiết kế với hệ thống thiết bị giản lược (thường công có ổ cứng), chủ yếu dùng để nhập dữ liệu hoặc dùng tại các nơi công cộng như điểm truy cập Internet .v.v - Desktop Computer: Máy tính để bàn - Workstation: Máy trạm, có thể chạy các phần mềm chuyên dụng - Midrange: Máy chủ cỡ nhỏ - Mainframe: Máy chủ cỡ lớn - Supercomputer: Siêu máy tính, chủ yếu dùng trong các ứng dụng khoa học kỹ thuật 2.2 Phần mềm Phần mềm là các chương trình máy tính dùng để điều khiển hoạt động của phần cứng máy tính hoặc thực hiện công việc cho người sử dụng. Chương trình máy tính bao gồm chuỗi các lệnh (instructions) dùng để chỉ thị cho máy tính làm việc. Tài liệu (documentation) là một loại văn bản dùng để mô tả các chức năng của chương trình nhằm giúp người dùng có thể thao tác khi sử dụng chương trình và hệ thống máy tính. Phần mềm có thểđược chia làm 2 loại, là phần mềm hệ thống và phần mềm ứng dụng. Phần mềm hệ thống (system software) là tập các phần mềm được thiết kếđể kết hợp các hoạt động và chức năng của phần cứng và các chương trình ứng dụng trong hệ thống máy tính. Các phần mềm hệ thống được thiết kế riêng cho các loại bộ xử lý và các dạng phần cứng khác nhau. Phần mềm ứng dụng (application software) bao gồm các chương trình dùng để giúp cho người sử dụng giải quyết vấn đề cụ thể nào đó bằng máy tính. Thông thường, các phần mềm ứng dụng được lưu trong ổ cứng của máy tính, và sau đó được nạp vào bộ nhớ chính và chạy. 27
  31. Ngoài ra, chương trình ứng dụng cũng có thểđược lưu ở các thiết bị lưu trữ khác như CD, DVD, flash .v.v. Hình 2.8 Phân loại phần mềm 2.2.1 Phần mềm hệ thống Điều khiển các thao tác của phần cứng máy tính là chức năng cơ bản của phần mềm hệ thống. Phần mềm hệ thống bao gồm hệđiều hành và phần mềm tiện ích. Hệđiều hành Hệđiều hành (OS - Operating System) là một tập các chương trình máy tính dùng để điều khiển phần cứng và đóng vai trò như một giao diện giữa phần cứng với phần mềm ứng dụng. Hình 2.9 Vai trò của hệđiều hành Hệđiều hành thường được lưu trên ổ cứng của máy tính. Khi hệ thống máy tính được khởi động, một số phần của hệđiều hành sẽđược nạp vào máy tính. Các chức năng cơ bản của hệ điều hành bao gồm: -Thực hiện các chức năng phần cứng thông thường - Cung cấp giao diện người dùng: Giao diện đồ họa (graphics) hoặc giao diện dòng lệnh (CLI - Command Line Interface) 28
  32. - Cung cấp sựđộc lập phần cứng: Đóng vai trò trung gian giữa chương trình và người dùng với phần cứng -Quản lý bộ nhớ hệ thống -Quản lý tác vụ - Cung cấp khả năng kết nối mạng - Điều khiển truy cập tài nguyên hệ thống -Quản lý file Hình 2.10 Giao diện lập trình ứng dụng Hình 2.11 Ví dụ về việc hệđiều hành điều khiển việc truy cập dữ liệu vật lý 29
  33. Các hệđiều hành thông dụng Hình 2.12 Các hệđiều hành thông dụng Phần mềm tiện ích Phần mềm tiện ích (utility program) là loại phần mềm được thiết kếđể trợ giúp việc quản lý và phối hợp phần cứng máy tính, hệđiều hành, và phần mềm ứng dụng. Một số phần mềm tiện ích đã được tích hợp sẵn vào hệđiều hành. Các phần mềm tiện ích thông dụng bao gồm: - Các phần mềm tiện ích đĩa: Chống phân mảnh đĩa (fragment), kiểm lỗi đĩa, làm sạch đĩa, phân vùng đĩa, nén dữ liệu, quản lý file .v.v - Các tiện ích hệ thống: Cung cấp các thông tin chi tiết về các phần mềm đã cài đặt lên máy tính và về phần cứng của máy tính - Các tiện ích an ninh như phần mềm diệt vi rus, phát hiện xâm nhập .v.v. -Phần mềm quản lý và kiểm soát mạng: Kiểm tra mạng, ghi lại sự kiện, kiểm tra truyền thông .v.v 30
  34. 2.2.2 Phần mềm ứng dụng Phần mềm ứng dụng có thểđược chia làm 2 loại: phần mềm phát triển độc quyền và phần mềm xây dựng sẵn. Phần mềm phát triển độc quyền là phần mềm được xây dựng riêng cho một đơn vị, tổ chức nào đó, và theo yêu cầu riêng của tổ chức đó. Phần mềm phát triển độc quyền có thể do tổ chức tự xây dựng hoặc thuê một đơn vị sản xuất phần mềm thực hiện theo yêu cầu. Loại phần mềm này còn gọi lại tailor-made software (phần mềm may đo). Phần mềm xây dựng sẵn là loại phần mềm được phát triển sẵn và có bán trên thị trường, các tổ chức có nhu cầu có thể mua vềđể sử dụng. Gói phần mềm xây dựng sẵn có thể là gói chuNn (không có chỉnh sửa), hoặc gói có thể chỉnh sửa lại theo yêu cầu. Việc chỉnh sửa có thể do đơn vị tự chỉnh sửa hoặc thuê đơn vị phát triển phần mềm thực hiện. Hình 2.13 Các loại phần mềm ứng dụng Tùy theo nhu cầu và điều kiện sử dụng, có thể chọn phát triển phần mềm độc quyền hay xây dựng sẵn. Với phần mềm độc quyền, người sử dụng sẽ có được chính xác các yêu cầu mong muốn như các chức năng, các báo cáo đầu ra .v.v. Ngoài ra, trong quá trình phát triển phần mềm, người sử dụng cũng sẽ tham gia từđầu do vậy sẽ nắm kỹ hơn về hệ thống và có khả năng điều khiển hệ thống tốt hơn sau này. Phát triển độc quyền cũng sẽđem lại sự chủđộng và linh hoạt hơn trong việc chỉnh sửa hệ thống để đáp ứng các thay đổi hoặc cải tiến. Tuy nhiên, phần mềm độc quyền cũng có những nhược điểm nhất định. Nhược điểm lớn nhất là sẽ tiêu tốn tài nguyên và thời gian để phát triển hệ thống từđầu. Ngoài ra, việc phát triển một hệ thống riêng biệt cũng sẽđem lại những rủi ro nhất định, chẳng hạn các chức năng hoặc hiệu năng hệ thống chưa được kiểm định trước đó bao giờ. 31
  35. Phần mềm xây dựng sẵn thường có chi phí thấp hơn, do nhà sản xuất có thểđồng thời bán cho nhiều đơn vị sử dụng với cùng một phần mềm. Ngoài ra, các rủi ro về chức năng cũng như hiệu năng hệ thống được giảm thiểu, vì phần mềm đã có sẵn và người sử dụng hoàn toàn có thể kiểm tra trước khi tiến hành mua. Phần mềm loại này cũng thường có chất lượng tốt hơn, do hệ thống đã được phát triển qua các nghiên cứu chung và trải qua quá trình sử dụng tại một sốđơn vị khác và được thử nghiệm, đánh giá, chỉnh sửa nhiều lần. Nhược điểm của phần mềm xây dựng sẵn là người sử dụng thường phải trả tiền cho rất nhiều chức năng họ không cần và không bao giờ sử dụng. Ngoài ra, phần mềm lại có thể thiếu các chức năng mà đơn vị cụ thể yêu cầu, và có thể phải chỉnh sửa, cải tiến trong tương lai với chi phí rất đắt. Phần mềm xây dựng sẵn cũng có thể không khớp với các quy trình nghiệp vụ và các chuNn dữ liệu vốn rất khác biệt giữa các đơn vị khác nhau. Ngôn ngữ lập trình Ngôn ngữ lập trình (programming language) là một ngôn ngữ nhân tạo, được thiết kếđể biểu thị các tính toán được thực hiện bởi máy tính. Đây chính là các công cụđể tạo nên các chương trình phần mềm để điều khiển hành vi của máy tính, biểu thị các thuật toán. Hầu hết các ngôn ngữ lập trình đều có các đặc tả về cú pháp và ngữ nghĩa để người sử dụng có thể dùng để viết nên các chương trình. Ngôn ngữ lập trình đã trải qua nhiều thế hệ phát triển, từ các ngôn ngữ bậc thấp nhất như ngôn ngữ máy cho đến các ngôn ngữ hiện đại ngày nay đang được sử dụng rộng rãi như Java, C#, C++ .v.v -Thế hệ thứ nhất: Các lệnh được viết dưới dạng mã máy (machine code) và được thực thi trực tiếp bởi máy tính. Đó chính là ngôn ngữ máy (machine language). -Thế hệ thứ 2: Các từ viết tắt được sử dụng cho các thao tác thông dụng (ví dụ ADD, MOV, JMP .v.v). Một sốđặc điểm của loại ngôn ngữ này là mỗi thao tác được theo sau bởi địa chỉ của các tham số và các tên gợi nhớđã được sử dụng để thay thế cho các địa chỉđược đánh bằng số. Đối với các chương trình viết bằng các ngôn ngữ này cần có các bộ hợp dịch để dịch ra ngôn ngữ máy để máy tính có thể thực thi được. Ngôn ngữđiển hình của thế hệ này là Hợp ngữ (Assembly language). -Thế hệ thứ 3: Với các ngôn ngữ thuộc thế hệ này, các lệnh đã trở nên tựa tiếng Anh hơn và dễ hiểu hơn. Cần có các chương trình dịch (compiler) để dịch ra ngôn ngữ máy. Ví dụđiển hình là các ngôn ngữ FORTRAN, COBOL, PASCAL .v.v. -Thế hệ thứ 4: Các ngôn ngữ trở nên dễ sử dụng, kể cả cho người không phải lập trình viên. Các lệnh có sức mạnh hơn, chỉ cần chỉ cho máy tính cần làm gì, không cần phải hướng dẫn chi tiết từng bước thực hiện. 32
  36. -Thế hệ thứ 5: Thế hệ các ngôn ngữ lập trình trực quan, cho phép người lập trình phát triển các ứng dụng qua các kỹ thuật kéo thả (drag-and-drop), thay vì viết mã lệnh bằng văn bản. Ví dụ Visual Basic, Visual C .v.v. -Thế hệ thứ 6: Ngôn ngữ lập trình hướng đối tượng. Thay vì xây dựng các chương trình theo mô hình hướng thủ tục, các ngôn ngữ này xây dựng chương trình dựa trên các đối tượng (object). Đối chứa dữ liệu và các phương thức, cùng với khả năng tương tác với các đối tượng khác. Các đối tượng có thểđược tái sử dụng trong các chương trình khác nhau, làm tăng chất lượng chương trình và năng suất của người lập trình. 33
  37. CHƯƠNG 3 TỔ CHỨC DỮ LIỆU VÀ THÔNG TIN Dữ liệu và thông tin là 1 trong 5 thành phần cốt lõi của Hệ thống thông tin. Một Hệ thống thông tin không thể coi là hoàn thiện nếu thiếu dữ liệu. Bên cạnh đó, việc tổ chức dữ liệu cho HTTT cũng là 1 vấn đề hết sức quan trọng. Chương này sẽ giới thiệu về vấn đề tổ chức dữ liệu và thông tin cho các HTTT. Phương pháp tổ chức dữ liệu truyền thống là thông qua quản lý tệp đã cho thấy nhiều nhược điểm khi sử dụng trong các HTTT. Phương pháp quản lý dữ liệu thông qua Cơ sở dữ liệu (CSDL) là phương pháp mới, có nhiều ưu điểm so với phương pháp truyền thống. Một CSDL được thiết kế và quản lý tốt sẽđem lại một công cụ hữu ích trong việc hỗ trợ ra quyết định. Các CSDL đều được quản lý bởi một Hệ quản trị CSDL. Hệ quản trị CSDL sẽ giúp cho việc quản lý CSDL trở nên dễ dàng và quy củ hơn, nó cho phép người sử dụng và các phần mềm lưu trữ và thu thập dữ liệu một cách có cấu trúc. Trong tương lai, các cải tiến về công nghệ tổ chức và quản lý CSDL sẽ tiếp tục được phát triển và đem lại nhiều lợi ích cho các tổ chức và doanh nghiệp. 3.1 Phân cấp dữ liệu Phân cấp dữ liệu nói đến việc tổ chức dữ liệu một cách có hệ thống, thường là theo định dạng phân cấp. Theo mô hình phân cấp, một CSDL sẽ có một hoặc nhiều file dữ liệu, mỗi file chứa dữ liệu về một lĩnh vực nào đó cần quản lý, chẳng hạn file chứa dữ liệu về nhân sự của 1 doanh nghiệp. Hình 3.1 Phân cấp dữ liệu 34
  38. File bao gồm một tập các bản ghi có liên quan, mỗi bản ghi đại diện cho 1 thực thể dữ liệu, chẳng hạn doanh nghiệp có 100 nhân viên thì mỗi nhân viên sẽđược lưu trữ trong 1 bản ghi và tập hợp 100 bản ghi tạo thành 1 file. Bản ghi là một tập các trường có liên quan, mỗi trường có thể coi là 1 thuộc tính của đối tượng dữ liệu, chẳng hạn bản ghi về Nhân viên có thể có các trường Mã NV, Họ tên, Ngày ký hợp đồng Mỗi trường chứa một đơn vị dữ liệu đơn lẻ, chẳng hạn Tên NV. Dưới góc độ lưu trữ, một trường dữ liệu bao gồm các ký tự, các bytes, và lưu trữ trong các thiết bị lưu trữ dưới dạng các bít dữ liệu. Khóa và thuộc tính Một file dữ liệu thường được biểu diễn dưới dạng các bảng, trong đó, mỗi hàng của bảng là 1 bản ghi, đại diện cho 1 thực thể dữ liệu. Mỗi cột của bảng là 1 trường, đại diện cho 1 thuộc tính của đối tượng dữ liệu. Hình 3.2 Khóa và thuộc tính Trong các thuộc tính của đối tượng dữ liệu, một hoặc một số các trường tạo nên một định danh duy nhất cho các bản ghi trong file được gọi là trường khóa của file. Trường khóa cũng dùng để xác định các trường khác và dùng để tìm kiếm các bản ghi trong file. 3.2 Quản lý dữ liệu theo phương pháp truyền thống và phương pháp CSDL Phương pháp quản lý dữ liệu truyền thống Theo phương pháp quản lý dữ liệu truyền thống, các file dữ liệu riêng rẽ sẽ được tạo và lưu trữ cho mỗi chương trình ứng dụng. Chẳng hạn mỗi lĩnh vực nghiệp vụ như kế toán, tài chính, sản xuất sẽ có các file dữ liệu và chương trình ứng dụng riêng rẽ. Điều này làm cho thông tin được xử lý độc lập và không có kết nối. 35
  39. Phương pháp quản lý thông qua CSDL Theo phương pháp này, một khối dữ liệu chung có liên quan sẽđược lưu trữ và chia sẻ bởi các chương trình ứng dụng khác nhau. Thay vì sử dụng các file dữ liệu rời rạc, mỗi chương trình ứng dụng sử dụng 1 tập dữ liệu được kết nối hoặc có liên quan trong toàn bộ CSDL chung. Hình 3.3 Phương pháp quản lý dữ liệu thông qua CSDL Ưu điểm của phương pháp quản lý dữ liệu thông qua CSDL -Tăng cường tính chiến lược của dữ liệu doanh nghiệp : Các dữ liệu chính xác, cập nhật, và hoàn thiện được cung cấp đầy đủ cho người ra quyết định khi cần thiết và đúng định dạng cần thiết. -Giảm tính dư thừa dữ liệu : Phương pháp tiếp cận CSDL làm giảm hoặc loại bỏ hoàn toàn tính dư thừa của dữ liệu. Dữ liệu được tổ chức bởi hệ quản trị CSDL và được lưu tại 1 nơi duy nhất. Điều này làm tăng tính hiệu quả trong việc lưu trữ dữ liệu, tránh lãng phí dung lượng lưu trữ. -Tăng cường tính toàn vẹn của dữ liệu : Với phương pháp truyền thống, các thay đổi trên dữ liệu sẽ không làm thay đổi trên tất cả các bản sao của dữ liệu đó được lưu trữ trên các file rời rạc. Điều này không xảy ra đối với CSDL, vì không có các bản sao dữ liệu được lưu trữở các file rời rạc khác nhau, và được lưu trữở 1 nơi duy nhất. 36
  40. -Dễ dàng chỉnh sửa và cập nhật dữ liệu : Với phương pháp CSDL, hệ quản trị CSDL sẽ chịu trách nhiệm việc cập nhật và chỉnh sửa dữ liệu. Người sử dụng và chuyên gia phát triển hệ thống không cần biết dữ liệu vật lý được lưu ởđâu. Dữ liệu được lưu trữ và chỉnh sửa chỉ 1 lần, tại 1 nơi duy nhất. -Chương trình và dữ liệu độc lập : Hệ quản trị CSDL tổ chức dữ liệu hoàn toàn độc lập với chương trình ứng dụng. Với phương pháp CSDL, chương trình ứng dụng không bị ảnh hưởng bởi vị trí lưu trữ dữ liệu vật lý hoặc kiểu dữ liệu vật lý. -Truy cập đến dữ liệu và thông tin tốt hơn : Hầu hết các hệ quản trị CSDL đều có các công cụ cho phép dễ dàng truy cập và thu thập dữ liệu từ CSDL. Các lệnh đơn giản được cung cấp để lấy các dữ liệu. Quan hệ giữa các phần dữ liệu trong CSDL có thể được khảo sát và xem xét một cách dễ dàng. -ChuNn hóa việc truy cập dữ liệu : Đặc điểm căn bản của phương pháp CSDL là một phương pháp truy cập dữ liệu đồng nhất, chuNn hóa. Điều này có nghĩa là các quy trình giống nhau được áp dụng bởi tất cả các chương trình ứng dụng để lưu trữ và thu thập dữ liệu. - Framework cho việc phát triển ứng dụng : Việc truy cập dữ liệu được chuNn hóa có nghĩa là việc phát triển chương trình ứng dụng được chuNn hóa hơn. Bởi vì chương trình ứng dụng thông qua CSDL để truy cập dữ liệu, việc chuNn hóa quá trình truy cập dữ liệu có thể tạo nên một framework thống nhất cho phát triển ứng dụng. Ngoài ra, do các chương trình ứng dụng chỉ cần làm việc với hệ quản trị CSDL, không phải làm việc với các file dữ liệu vật lý, do vậy có thể làm giảm thời gian phát triển hệ thống. -Bảo vệ dữ liệu tốt hơn : Việc sử dụng và truy cập các dữ liệu được lưu trữ tập trung sẽ làm cho việc quản lý và điều khiển được dễ dàng hơn. Các kỹ thuật như mã truy cập hoặc mật khNu có thểđược áp dụng để đảm bảo chỉ những người sử dụng có quyền mới được truy cập vào các phần nhất định của CSDL. -Dễ dàng hơn trong việc chia sẻ dữ liệu và tài nguyên : Chi phí cho các phần cứng, phần mềm, nhân sự quản lý dữ liệu được chia sẻ bởi nhiều người sử dụng và các ứng dụng khác nhau. Nhược điểm của phương pháp quản lý dữ liệu thông qua CSDL - Chi phí cho các phần mềm quản trị CSDL có thể sẽ tương đối lớn, đặc biệt là các hệ quản trị CSDL cho các ứng dụng lớn. -Gia tăng chi phí cho người quản lý CSDL : Việc quản trị CSDL cần có nhân viên có chuyên môn trong lĩnh vực này. Tuy nhiên, một số tổ chức có thể thiết lập và duy trì hoạt động của CSDL mà không cần có người chuyên môn hóa. 37
  41. -Gia tăng tính dễ bị tấn công của dữ liệu : Mặc dù CSDL mang lại tính an toàn hơn bởi các phương tiện bảo vệ có thể tập trung một nơi, nhưng cũng làm cho dữ liệu dễ bị tấn công bởi những người truy cập trái phép một khi hệ thống an ninh bị vô hiệu hóa. Ngoài ra, nếu hệ quản trị CSDL bị lỗi hoặc ngừng hoạt động vì một lý do nào đó, tất cả các ứng dụng liên quan sẽ bịảnh hưởng. 3.3 Mô hình hóa dữ liệu Để tạo ra được các CSDL, trước hết phải tạo được các mô hình dữ liệu. Mô hình dữ liệu là một mô hình trừu tượng mô tả dữ liệu được biểu thị và truy cập như thế nào. Mô hình dữ liệu định nghĩa các thành phần dữ liệu và quan hệ giữa chúng, được biểu thị dưới dạng các sơđồ (diagrams). Các sơđồ này cũng cho thấy cơ sở dữ liệu được tổ chức như thế nào. Mô hình hóa dữ liệu (Data Modelling) là quá trình tạo ra các mô hình dữ liệu thông qua việc áp dụng các kỹ thuật mô tả mô hình dữ liệu. Mô hình hóa dữ liệu doanh nghiệp là việc thực hiện tạo mô hình dữ liệu ở mức toàn bộ doanh nghiệp, tổ chức. Một trong các kỹ thuật thường được sử dụng để mô hình hóa dữ liệu là Sơđồ quan hệ thực thế (Entity-Relationship Diagram). E-R diagram là một sơđồđịnh danh các thực thể xuất hiện trong hệ thống và mối quan hệ giữa chúng. Các thành phần chính của một E-R diagram bao gồm các thực thể (Entities), các mối quan hệ (Relationships), trọng số của quan hệ (Cardinality). Hình 3.4 Mô hình quan hệ thực thể hệ thống bán hàng Trong sơđồ quan hệ thực thể trên có 6 thực thể là Người bán hàng (Salesperson), Khách hàng (Customer), Đơn đặt hàng (Order), Hóa đơn (Invoice), Mục hàng (Items) và Sản phNm (Product). Các quan hệ bao gồm : 38
  42. -Người bán hàng phục vụ Khách hàng - Khách hàng đặt hàng các Đơn hàng - Đơn hàng bao gồm các Mục hàng -Mục hàng thuộc loại Sản phầm - Đơn hàng tạo ra Hóa đơn Các quan hệ có thể là 1 – n : Chẳng hạn Người bán hàng phục vụ nhiều Khách hàng và 1 Khách hàng chỉđược phụ vụ bởi 1 Người bán hàng. Hoặc có thể là quan hệ 1 – 1 : Một đơn hàng sẽ tạo ra 1 hóa đơn và ngược lại. 3.4 Các mô hình CSDL Mô hình CSDL (Database Model) là cấu trúc hoặc định dạng của 1 CSDL, được mô tả bằng một ngôn ngữ chính thức được hỗ trợ bởi hệ quản trị CSDL. Nói cách khác, mô hình CSDL là ứng dụng của mô hình dữ liệu khi sử dụng cùng với hệ quản trị CSDL. Nó là một phương pháp dùng để mô tả việc CSDL có cấu trúc thế nào và sử dụng ra sao. Mô hình CSDL được sử dụng phổ biến hiện nay là mô hình quan hệ (Relational Model), tuy nhiên, trước đó cũng có một số mô hình khác được giới thiệu và sử dụng khá rộng rãi, đó là các mô hình phân cấp (Hierarchical Model) và mô hình mạng (Network Model). Mô hình phân cấp Mô hình phân cấp là mô hình trong đó dữ liệu được tổ chức dưới dạng hình cây. Cấu trúc này cho phép lặp lại thông tin thông qua các quan hệ cha/con: Mỗi đối tượng cha có thể có nhiều đối tượng con, trong khi mỗi đối tượng con chỉ có tối đa 1 cha. Đây là mô hình CSDL đầu tiên ra đời nhằm giải quyết các vấn đề của việc sử dụng các file dữ liệu rời rạc. Mô hình phân cấp được sử dụng khá rộng rãi vào cuối những năm 1960s và cho đến những năm 1970s, điển hình là việc IBM đã chọn mô hình này áp dụng cho các sản phNm hệ quản trị CSDL đầu tiên của mình. 39
  43. Hình 3.5 Mô hình phân cấp Mô hình mạng Mô hình mạng được xem là một trong những mô hình có cách biểu diễn các đối tượng dữ liệu và quan hệ giữa chúng một cách linh hoạt hơn. Khác với mô hình phân cấp, mô hình mạng cho phép mỗi đối tượng có thể có thể nhiều cha và nhiều con, hình thành nên một cấu trúc lưới. Hình 3.7 Mô hình mạng Ưu điểm chính của mô hình này so với mô hình phân cấp nằm ở chỗ nó cho phép mô hình hóa các mối quan hệ giữa các đối tượng theo một cách tự nhiên hơn. Mặc dù mô hình này đã được thực thi và sử dụng khá rộng rãi, tuy nhiên từ khi mô hình quan hệ ra đời và nhanh chóng trở thành mô hình thống trị trong lĩnh vực CSDL thì mô hình mạng không còn được sử dụng rộng rãi. Trên thực tế, cho đến cuối những năm 1980s, những ưu điểm về hiệu năng của các mô hình phân cấp và mô hình mạng vẫn được sử dụng trong các hệ thống lớn, tuy nhiên, 40
  44. các thiết bị phần cứng ngày càng có khả năng xử lý nhanh, mạnh hơn, và mô hình quan hệ với các ưu điểm về tính linh hoạt và hiệu quảđã dần làm biến mất sựứng dụng của 2 mô hình này trong các ứng dụng cho doanh nghiệp. Mô hình quan hệ Mô hình quan hệđược phát triển và giới thiệu lần đầu vào năm 1969 bởi E.F. Codd, một nhà khoa học người Anh làm việc cho IBM. Về căn bản, mô hình quan hệ tạo nên mô hình logic của dữ liệu dựa trên 2 khái niệm: Vùng (chẳng hạn kiểu dữ liệu) và các Quan hệ. Vùng là 1 tập các giá trị, cùng với các toán tử thao tác trên đó. Một quan hệ (relation) trên n vùng D1, D2, , Dn là một tập con của phép tính tích Đề các D1 x D2 x x Dn. Một thành phần của tập kết quả tích Đề các này được gọi là 1 bộ giá trị (tuple). Nói cách khác, mô hình quan hệ cho phép biểu thị dữ liệu dưới dạng các bảng. Mỗi hàng của bảng biểu thị một mối quan hệ giữa các Vùng giá trị, và một bảng biểu thị một tập các mối quan hệ. Mỗi cột của bảng biểu thị một Vùng giá trị. Như vậy, một bảng tương đương với một quan hệ và một hàng (còn gọi là bản ghi - record) tương đương với 1 bộ giá trị, và một cột (còn gọi là thuộc tính) tương đương với 1 Vùng. Hình 3.8 Mô hình quan hệ 41
  45. Một số phép toán thông dụng trên CSDL quan hệ: - Phép chọn (Selecting): Phép chọn cho phép lọc ra một tập con các bản ghi từ một hoặc nhiều bảng thỏa mãn các điều kiện lọc nào đó. - Phép chiếu (Projecting): Trong khi phép chọn thực hiện lọc theo hàng thì phép chiếu thực hiện lựa chọn và lọc theo cột, dùng để chọn lọc 1 tập các thuộc tính của 1 hoặc nhiều quan hệ. - Phép nối (Join): Dùng để kết hợp các bản ghi từ 2 bảng thông qua việc khớp các giá trị trong các trường có cùng Vùng giá trị (thông thường các trường này có cùng tên, nhưng nằm ở các bảng khác nhau). Hình 3.9 Kết nối các bảng dữ liệu 42
  46. Tạo và hiệu chỉnh CSDL Hình 3.10 Tạo và hiệu chinrhCSDL bằng Microsoft Access Sau khi xây dựng xong mô hình CSDL, có thể chuyển chúng thành các CSDL vật lý bằng các công cụđược cung cấp bởi các hệ quản trị CSDL, như tạo mới, hiệu chỉnh các đối tượng dữ liệu. 3.5 Hệ quản trị CSDL Hệ quản trị CSDL (Database Management System - DBMS) là một tập các chương trình phần mềm thực hiện các công việc thiết lập, duy trì, hiệu chỉnh và điều hành các thao tác với dữ liệu trong các CSDL của các tổ chức, doanh nghiệp và người sử dụng. Các tổ chức, doanh nghiệp, thường giao trách nhiệm quản lý và vận hành các hệ quản trị CSDL của mình cho những chuyên gia quản trị CSDL (Database Administrator) hoặc các chuyên gia kỹ thuật chuyên trách. Hệ quản trị CSDL có thể sử dụng một trong các mô hình CSDL nhưđã nói ở phần trên, như mô hình phân cấp hoặc mô hình quan hệ. Các hệ quản trị CSDL hiện đại thường cho phép người sử dụng và các phần mềm lưu trữ và thu thập dữ liệu theo một cách có cấu trúc, đồng thời cung cấp các phương tiện để điều khiển truy cập dữ liệu, đảm bảo tính toàn vẹn dữ liệu, quản lý việc điều khiển tương tranh, khôi phục dữ liệu .v.v. Lược đồ CSDL (Database Schema) 43
  47. Lược đồ của một hệ CSDL là cấu trúc của nó được mô tả bởi một ngôn ngữ hình thức được hỗ trợ bởi hệ quản trị CSDL. Trong một CSDL quan hệ, lược đồ CSDL định nghĩa các bảng, các trường, các quan hệ, .v.v. và các đối tượng khác. Lược đồ thường được lưu trong từ điển dữ liệu và thường được định nghĩa bằng ngôn ngữ CSDL văn bản, tuy nhiên thuật ngữ này thường chỉ một sự mô tả trực quan cấu trúc của CSDL. Lược đồ có thể chia làm nhiều cấp. Ở mức khái niệm, lược đồ khái niệm biểu thị sơđồ các khái niệm và mối quan hệ giữa chúng. Lược đồ logic biểu thị các thực thế, các thuộc tính, và các mối quan hệ. Lược đồ vật lý là sự thực thi cụ thể của lược đồ logic. Lược đồ con (Subschema): Trong khi lược đồ CSDL là bản mô tả toàn bộ CSDL thì lược đồ con mô tả một tập con của CSDL và chỉ ra những người dùng nào có thể thao tác trên tập con đó. Có một số lý do để đưa ra lược đồ con: -Lược đồ con cung cấp các view khác nhau của dữ liệu cho người dùng và người phát triển hệ thống, khi họ không cần biết tất cả dữ liệu trong CSDL. -Lược đồ con làm tăng cường tính an toàn của CSDL và ngăn chặn việc làm tổn hại đến dữ liệu. -Lược đồ con có thể trợ giúp cho người quản trị CSDL, trong khi vẫn đảm bảo tính toàn vẹn dữ liệu. Hình 3.11 Lược đồ con 44
  48. Ngôn ngữđịnh nghĩa dữ liệu (Data Definition Language) Là tập các lệnh dùng để định nghĩa và mô tả dữ liệu và quan hệ dữ liệu trong CSDL. Đây là ngôn ngữ dùng để tạo nên các lược đồ CSDL. Ban đầu, nó được xem như 1 tập con của ngôn ngữ SQL, nhưng hiện nay nó được dùng để chỉ bất kỳ ngôn ngữ hình thức nào mô tả các cấu trúc dữ liệu, chẳng hạn các XML schemas. Từđiển dữ liệu (Data Dictionary) Từđiển dữ liệu là các thông tin mô tả chi tiết dữ liệu trong CSDL như ý nghĩa, quan hệ với các dữ liệu khác, nguồn gốc, việc sử dụng, định dạng .v.v. Nói cách khác đây là 1 tài liệu dùng để mô tả CSDL, hay còn gọi là siêu dữ liệu về CSDL, mô tả các bảng, các trường, các thông tin chi tiết như kiểu dữ liệu hay độ dài dữ liệu .v.v. Lưu trữ và thu thập dữ liệu Các chương trình ứng dụng và người dùng truy cập dữ liệu thông qua hệ quản trị CSDL và không làm việc trực tiếp với dữ liệu vật lý. Đường truy cập này gọi là đường truy cập logic (LAP - Logical Access Path). Thao tác trực tiếp với dữ liệu vật lý trên các thiết bị lưu trữ là nhiệm vụ của hệ quản trị CSDL và đường truy cập này gọi là đường truy cập vật lý (PAP - Physical Access Path). Hình 3.12 Truy cập dữ liệu 45
  49. Ngôn ngữ SQL (Structured Query Language) SQL là một ngôn ngữ CSDL được thiết kếđể quản lý dữ liệu trong các hệ quản trị CSDL quan hệ. Ngôn ngữ này bao gồm các truy vấn và cập nhật dữ liệu, tạo và chỉnh sửa lược đồ CSDL, điều khiển truy cập dữ liệu. Hình 3.13 Sử dụng SQL trong Microsoft Access SQL được phát triển lần đầu tại IBM và đầu những năm 70s, với mục đích làm ngôn ngữ thao và thu thập dữ liệu chứa trong các CDSL quan hệ của IBM và sau này được công nhận và sử dụng rộng rãi trên toàn thế giới. SQL có cú pháp khá đơn giản, có thể là 1 câu lệnh truy vấn để thu thập dữ liệu từ CSDL hoặc 1 câu lệnh dùng để thao tác với dữ liệu trong CSDL như thêm mới, chỉnh sửa, xóa Đầu ra của CSDL Bên cạnh các công cụ cho phép thiết lập, hiệu chỉnh, thao tác với CSDL, các hệ quản trị CSDL cũng có các công cụ cho phép thiết lập các báo cáo đầu ra của CSDL. Đây là những báo cáo tổng hợp hoặc chọn lọc dữ liệu theo yêu cầu được trình bày theo những định dạng mong muốn của người dùng và có thể in ấn thành các bản trên giấy để phục vụ cho mục đích sử dụng lâu dài. 46
  50. Hình 3.14 Tạo báo cáo đầu ra trong Microsoft Access Các hệ quản trị CSDL phổ biến Hiện nay có khá nhiều hệ quản trị CSDL được sử dụng trên thế giới, được cung cấp bởi các hãng phần mềm có tên tuổi, trong đó phải kểđến các sản phNm sau: - Oracle: Là hệ quản trị CSDL được phát triển bởi hãng phần mềm có cùng tên. Cho đến nay, đây vẫn được coi là sản phNm nổi tiếng nhất trong lĩnh vực CSDL. - MS SQL Server: Là sản phNn của hãng phần mềm khổng lồ Microsoft. Ra đời sau và được xem là có chất lượng chưa bằng Oracle đặc biệt là trong các ứng dụng lớn, nhưng MS SQL Server cũng là sản phNn CSDL rất phổ biến trên thị trường. - DB2: DB2 là 1 trong những sản phNn CSDL nằm trong họ hệ quản trị CSDL quan hệ của IBM. Đây là 1 hệ quản trị CSDL có lịch sử lâu đời và được xem là 1 trong những hệ quản trị CSDL đầu tiên sử dụng SQL mặc dù Oracle giới thiệu bản thương mại sớm hơn. DB2 hiện được coi là hệ quản trị CSDL tốt thứ 2, chỉ sau Oracle. - Informix: Cũng là 1 sản phNm của IBM, thực chất được IBM mua lại từ 2001. -MySQL: Là hệ quản trị CSDL mã nguồn mở nổi tiếng được giới thiệu lần đầu vào năm 1995 và thường được sử dụng trong các dự án phần mềm miễn phí. 47
  51. - MS Access: Là ứng dụng CSDL cỡ nhỏ của Microsoft Thị phần của các sản phNm hệ quản trị CSDL được sử dụng trên thị thường Mỗi sản phNm hệ quản trị CSDL đều có những đặc điểm riêng của mình, qua đó được người dùng đánh giá và lựa chọn. Được ưa chuộng nhất hiện nay vẫn là sản phNm của Oracle, tiếp theo là các sản phNm của IBM và Microsoft. Other; 11,4 Sysbase; 3 Oracle IBM Microsoft; 17,4 Oracle; 47,1 Microsoft Sysbase Other IBM; 21,1 Hình 3.15 Thị phần các sản phNm hệ quản trị CSDL Lựa chọn hệ quản trị CSDL phù hợp Với số lượng đa dạng các sản phNm hệ quản trị CSDL được cung cấp bởi các doanh nghiệp phần mềm trên thị thường, người sử dụng có thể lựa chọn cho mình sản phNm phù hợp dựa trên nhu cầu cũng như các tiêu chí khác. Dưới đây là một số các yếu tố quan trọng cần xem xét khi lựa chọn một hệ quản trị CSDL: - Kích thước CSDL: Các hệ quản trị CSDL có thể hỗ trợ các CSDL có kích thước tối đa khác nhau. Do vậy, cần xem xét kích thước CSDL để chọn loại phù hợp. -Số người dùng đồng thời: Số lượng người sử dụng, đặc biệt là số người sử dụng đồng thời, là 1 tham số quan trọng. Mỗi người dùng khi sử dụng hệ quản trị CSDL sẽ làm cho hệ thống phải phục vụ các thao tác của họ, do vậy khi số người dùng đồng thời tăng lên, có nghĩa hệ quản trị CSDL phải có khả năng phục vụ nhiều hơn. Một số hệ quản trị CSDL có khả năng phục vụổn định 1 số lượng lớn người dùng, trong khi 1 số hệ thống chỉ có thể phục vụ 1 số ít hoặc vừa phải. 48
  52. -Hiệu suất: Hiệu suất của 1 hệ quản trị CSDL nói đến năng lực xử lý của hệ thống. - Tính năng: Hầu hết các hệ quản trị CSDL hiện đại đều có cùng một số tính năng cơ bản, tuy nhiên, một số hệ quản trị CSDL có thể không hỗ trợ các tính năng đặc biệt hoặc nâng cao, chẳng hạn các câu lệnh SQL phức tạp hoặc các tính năng liên quan đến thao tác dữ liệu. Do vậy khi lựa chọn hệ quản trị CSDL cần chọn loại có hỗ trợ các tính năng cần thiết của hệ thống. - Nhà cung cấp: Lựa chọn dựa trên nhà cung cấp đặc biệt được quan tâm khi cân nhắc đến tính tương thích giữa các phần các nhau của hệ thống, kể cả phần cứng hoặc các phần mềm khác liên quan như hệđiều hành, Web server, .v.v. -Giá cả: Đây là 1 yếu tố rõ ràng là rất quan trọng. Các hệ quản trị CSDL tốt thường cho giá cả khá cao, trong khi một số loại khác giá thấp hơn nhưng cũng có khả năng đáp ứng yêu cầu. Do vậy cần cân nhắc lựa chọn hệ thống phù hợp cả về chất lượng và chi phí nằm trong kế hoạch cho phép. 3.6 Ứng dụng khác của CSDL Kho dữ liệu (Data Warehouse) Kho dữ liệu là một CSDL thu thập các thông tin nghiệp vụ của tổ chức từ rất nhiều nguồn khác nhau, trong tất cả các lĩnh vực hoạt động của tổ chức. Nói cách khác, kho dữ liệu lưu trữ các dữ liệu nhất quán, đã được chuNn hóa và làm sạch, từ nhiều khuôn dạng tích hợp, có nguồn gốc từ các hệ thống nghiệp vụ khác nhau, được tổ chức và thiết kếđể phục vụ cho mục đích phân tích dữ liệu và tạo các báo cáo dữ liệu, hỗ trợ cho việc ra quyết định. Theo định nghĩa hẹp, kho dữ liệu chỉ bao gồm việc lưu trữ dữ liệu. Tuy nhiên, ngày nay khi nói đến kho dữ liệu người ta thường hiểu theo nghĩa rộng hơn, bao gồm cả việc tổng hợp và phân tích dữ liệu, cả việc thu thập, chuyển đổi, nạp dữ liệu vào kho, các công cụđể quản lý siêu dữ liệu .v.v. Không có một kiến trúc chi tiết chuNn nào cho kho dữ liệu. Có nhiều kiểu kiến trúc tùy thuộc từng môi trường và bối cảnh khác nhau, tuy nhiên, nhìn chung các kho dữ liệu thường có cấu trúc tổng thể bao gồm các lớp có liên quan sau: -Lớp CSDL nghiệp vụ: Đây chính là nguồn của kho dữ liệu, chẳng hạn các hệ thống quản lý nghiệp vụ v.v.v -Lớp truy cập dữ liệu: Giao diện giữa lớp truy cập thông tin và lớp CSDL nghiệp vụ. Đây chính là các công cụ dùng để thu thập, chuyển đổi, nạp dữ liệu vào kho. -Lớp siêu dữ liệu: Đây thường là phần dữ liệu mô tả, chi tiết hơn so với dữ liệu nghiệp vụ. 49
  53. -Lớp truy cập thông tin: Tại lớp này, dữ liệu được truy cập để tạo báo cáo và phân tích, bao gồm các công cụđể phân tích kinh doanh, khai phá dữ liệu .v.v. Hình 3.16 Kho dữ liệu Việc lưu trữ dữ liệu trong kho dữ liệu cũng có sự khác biệt so với các hệ thống nghiệp vụ. Các hệ thống nghiệp vụđược tối ưu hóa để đảm bảo cho tính toàn vẹn dữ liệu, chú trọng vào việc lưu trữ và quản lý giao dịch nghiệp vụ thông qua việc chuNn hóa CSDL và mô hình quan hệ thực thể. Các CSDL khi đó được chuNn hóa và chia ra làm rất nhiều bảng dữ liệu, chúng được quản lý một cách hiệu quả thông qua các CSDL quan hệ. Các CSDL này có hiệu suất cập nhật thông tin rất nhanh bởi vì chỉ có 1 lượng nhỏ dữ liệu trong các bảng này bịảnh hưởng mỗi lần giao dịch nghiệp vụđược xử lý. Ngoài ra, để nâng cao hiệu suất xử lý, các dữ liệu cũ thường được thanh lọc dần ra khỏi CSDL nghiệp vụ. Trong khi đó, kho dữ liệu được tối ưu hóa cho việc thu thập và phân tích thông tin. Thông thường, dữ liệu trong kho dữ liệu không được chuNn hóa chặt chẽ. Ngoài ra, để tăng tốc tốc truy cập thông tin, dữ liệu trong kho thường được lưu trữ nhiều lần. Dữ liệu được lấy từ các hệ thống nghiệp vụ và được lưu giữ trong kho dữ liệu thậm chí kể cả sau khi nó đã bị thanh lọc ra khỏi hệ thống nghiệp vụ. Xử lý phân tích trực tuyến (OLAP) và khai phá dữ liệu (Data mining) 50
  54. Trong các hệ thống kho dữ liệu, có một số phương pháp phân tích, trong đó phải kểđến phương pháp Xử lý phân tích trực tuyến (OLAP – Online Analytical Processing) và Khai phá dữ liệu (Data mining). Khai phá dữ liệu là quá trình phát hiện ra các mẫu dữ liệu Nn và các mối quan hệ trong kho dữ liệu. Với việc dữ liệu được thu thập ngày càng nhiều, khai phá dữ liệu ngày càng trở thành một công cụ quan trọng trong việc chuyển đổi dữ liệu thành thông tin có ích. Sau đây là một sốứng dụng thông dụng của khai phá dữ liệu: -Làm thương hiệu, định vị sản phNm và dịch vụ: Cho phép các chiến lược gia hình dung ra những vị trí khác nhau của đối thủ trong một thị trường cho trước sử dụng dữ liệu trên một số các tính năng quan trọng của sản phNm. - Phân tích sự rời bỏ của khách hàng: Dự báo tỷ lệ số khách hàng hiện tại sẽ rời bỏ doanh nghiệp để đến với đối thủ. - Marketing trực tiếp: Chỉ ra các khách hàng tiềm năng có vẻ như sẽđáp ứng lại trong 1 chiến dịch marketing trực tiếp như qua điện thoại hoặc email. - Phát hiện gian lận: Chỉ ra các giao dịch có dấu hiệu lừa đảo hoặc bất hợp pháp. - Phân tích xu hướng mua bán: Chỉ ra các sản phNm và dịch vụ thường được mua cùng thời điểm (chẳng hạn phụ nữ mua son thường mua cùng nước hoa). - Phân đoạn thị trường: Phân nhóm các khách hàng dựa trên đặc tính hoặc sở thích. - Phân tích xu hướng thị trường: Phân tích các tham số chính như doanh số, khối lượng tiêu dùng, ưu đãi thay đổi theo thời gian như thế nào. Trong khi khai phá dữ liệu làm việc ở mức chi tiết thì OLAP làm việc ở mức tổng quan hơn. OLAP là phương pháp phân tích dạng top-down, hướng truy vấn và yêu cầu người sử dụng có kiến thức về dữ liệu và bối cảnh nghiệp vụ. Khai phá dữ liệu là phân tích bottom-up, hướng khai phá và người sử dụng phải tin tưởng vào công cụ khai phá dữ liệu để phát hiện ra các dữ liệu và giả thiết chưa có. 51
  55. CHƯƠNG 4 CÁC HỆ THỐNG TRUYỀN THÔNG Bên cạnh các hệ thống phần cứng, phần mềm là nền tảng cho hệ thống thông tin, trong thời đại kết nối ngày nay, các hệ thống truyền thông cũng được coi như không thể thiếu đối với việc phát triển các hệ thống thông tin bởi hầu hết các hệ thống thông tin hiện nay đều hoạt động trong môi trường mạng. Việc sử dụng hiệu quả các hệ thống truyền thông, các hệ thống mạng sẽ làm cho tổ chức, doanh nghiệp, trở nên nhanh nhạy và sáng tạo hơn, tạo ra một lợi thế cạnh tranh lâu dài. Trong phần đầu chương, chúng ta sẽ xem xét các khái niệm về hệ thống truyền thông, các thành phần cơ bản của hệ thống truyền thông, các phương án xử lý dữ liệu cơ bản và ưu nhược điểm của các phương pháp. Trong các hệ thống truyền thông, Internet rõ ràng là một hệ thống rất quan trọng và được sử dụng cực kỳ rộng rãi. Internet cung cấp nhiều dịch vụđa dạng cho người sử dụng và các tổ chức, doanh nghiệp. Chương này cũng sẽ mô tả sơ lược về hoạt động của Internet, các phương pháp kết nối Internet, vai trò của các nhà cung cấp dịch vụ Internet và các dịch vụ căn bản trên Internet, trong đó có World Wide Web. Xuất phát từ một hệ thống quản lý tài liệu, Web đã trở thành một dịch vụ không thể thiếu cho người dùng Internet, kể cả người dùng cá nhân hay các tổ chức. Phần cuối của chương sẽ trình bày các khái niệm về Web, hoạt động của Web, bao gồm việc sử dụng các trình duyệt, search engine và các công cụ Web khác, đồng thời cũng xem xét các khái niệm Intranet, Extranet, và việc các tổ chức sử dụng chúng ra sao. 4.1 Các thành phần của hệ thống viễn thông Viễn thông được hiểu là việc truyền tải thông tin qua một khoảng cách xa nhằm phục vụ cho việc liêc lạc, giao tiếp, truyền thông. Ngày nay, viễn thông thường liên quan đến việc sử dụng các thiết bịđiện tử nhưđiện thoại, truyền hình, radio, máy tính .v.v. Một hệ thống viễn thông điển hình thường bao gồm các thành phần sau: -Hệ thống gửi thông tin: Là hệ thống phát ra thông tin, là nguồn nơi thông tin sẽ xuất phát để đi tới đích. Thông tin này sẽđược chuyển đổi thành tín hiệu trước khi chuyển đi. - Tín hiệu: Là thông tin đã được chuyển đổi để truyền đi trên đường truyền. -Phương tiện truyền dẫn: Là thành phần truyền tải tín hiệu. 52
  56. -Thiết bị viễn thông: Là các thiết bị dùng để chuyển đổi tín hiệu sang dạng phù hợp và/hoặc thực hiện các nhiệm vụ truyền thông khác. -Hệ thống nhận: Là hệ thống sẽ nhận tín hiệu và chuyển đổi lại thành thông tin để sử dụng. Hình 4.1 Các thành phần của hệ thống viễn thông Các loại phương tiện truyền dẫn Có nhiều loại phương tiện truyền dẫn khác nhau, dùng cho các loại tín hiệu khác nhau. Sau đây là 1 số loại điển hình: -Cáp xoắn đôi (Twisted-Pair Cable): Là loại cáp sử dụng các cặp sợ dây đồng xoắn vào nhau, có thể bọc hoặc không bọc. Loại cáp này được sử dụng rộng rãi cho các dịch vụ điện thoại hoặc mạng máy tính có khoảng cách gần, nhưng nhược điểm là tốc độ chậm và độ dài tối đa bị giới hạn. -Cáp đồng trục (Coaxial Cable): Loại cáp có 1 lõi dẫn điện bên trong và bao bọc bởi lớp cách điện và sau đó lại được bọc bởi 1 lớp dẫn nữa và cuối cùng tất cảđược bao phủ bởi lớp vỏ bên ngoài. Cáp này có tốc độ truyền cao hơn cáp xoắn đôi, tuy nhiên giá thành cao hơn và việc triển khai phức tạp hơn. - Cáp quang (Fiber-optic Cable): Bao gồm rất nhiều những sợi thủy tinh cực nhỏđượ c bó lại với nhau trong 1 lớp vỏ bọc. Loại cáp này sử dụng các tia ánh sáng để truyền dữ liệu. Cáp quang có kích thước nhỏ hơn nhiều so với cáp đồng, có khả năng truyền dữ liệu tốc độ cực cao, đi xa, mà không bị méo tín hiệu. Tuy nhiên, cáp quang là loại phương tiện truyền dẫn có giá thành và chi phí triển khai rất cao. -Truyền dẫn viba (Microwave): Sử dụng các tín hiệu radio tần số cao để truyền qua không gian. Đây là phương pháp truyền vô tuyến, có ưu điểm không phải triển khai 53
  57. dây, và có thể truyền tốc độ cao. Nhược điểm là không được có vật cản trên đường truyền giữa bên gửi và bên nhận. Ngoài ra, tín hiệu có thể dễ bị can thiệp. -Truyền dẫn tế bào (Cellular): Cũng là phương pháp vô tuyến, chia vùng hoạt động ra thành các tế bào. Hỗ trợ cho người dùng di dộng, tín hiệu cũng dễ bị can thiệp. -Truyền dẫn hồng ngoại (Infrared): Tín hiệu được truyền qua không khí dưới dạng các sóng ánh sáng. Tiện lợi trong việc di chuyển thiết bị, tuy nhiên phải không có vật cản trên đường truyền và chỉ áp dụng được trong khoảng cách ngắn. Hình 4.2 Phương tiện truyền dẫn Các thiết bị viễn thông phổ biến - Modem (Modulator - Demodulator): Là thiết bị có chức năng chuyển đổi tín hiệu từ dạng số (digital) sang dạng tương tự (analog) để có thể truyền đi trên hệ thống truyền dẫn điện thoại thông thường. Quá trình này gọi là điều chế (modulation). Thiết bị này cũng thực hiện chức năng ngược lại là giải điều chế (demodulation) để chuyển đổi tín hiệu tương tự ngược trở lại tín hiệu số. - Fax modem: Các thiết bị Fax cho phép truyền đi các bản sao văn bản qua đường điện thoại thông thường. Fax modem là một thiết bị kết hợp giữa fax và modem, tạo cho người dùng một công cụ truyền thông rất hiệu quả. -Bộ dồn kênh (Multiplexer): Bộ dồn kênh cho phép một vài tín hiệu truyền thông chia sẻ và có thể cùng truyền trên một đường truyền duy nhất tại cùng thời điểm, nhờđó có thể làm giảm chi phí truyền thông. Tại đầu nhận thông tin, cần có một thiết bị tách kênh (Demultiplexer) để tách tín hiệu. - PBX (Private Branch Exchange): Tổng đài cá nhân tựđộng. Là thiết bị tổng đài phục vụ riêng cho một tổ chức hoặc một doanh nghiệp. PBX cho phép thiết lập các cuộc gọi nội bộ trong hệ thống hoặc kết nối ra hệ thống mạng ngoài qua một sốđường điện thoại của nhà cung cấp dịch vụ viễn thông. 54
  58. Nhà cung cấp và các dịch vụ viễn thông Các nhà cung cấp dịch vụ viễn thông là các nhà cung cấp dịch vụđiện thoại và các dịch vụ truyền thông khác tương tự. Một số loại dịch vụ truyền thông phổ biến: -Dịch vụđiện thoại thông thường (Standard Phone): Đây là dịch vụ rất phổ biến, có đặc điểm là giá rẻ, nhưng tốc độ thấp (56 Kpbs), chủ yếu phù hợp với việc truyền các cuộc gọi điện thoại, không phù hợp cho các ứng dụng truyền video và dữ liệu lớn. -Mạng số tích hợp đa dịch vụ (ISDN - Integrated Services Digital Network): Là một loại hình mạng theo kỹ thuật số, có khả năng tích hợp nhiều loại dịch vụ trên cùng 1 đường truyền. Tốc độ tối đa có thể lên tới vài Mbps, thích hợp cho các ứng dụng tốc độ cao, nhưng giá cảđắt hơn và không phổ biến rộng như dịch vụđiện thoại thông thường. -Dịch vụđường dây thuê bao số (DSL - Digital Subscriber Line): DSL hoặc xDSL là một họ các công nghệ cung cấp dịch vụ truyền dữ liệu dạng số trên các đường dây thuê bao điện thoại thông thường. DSL có thểđược sử dụng cùng thời điểm trên cùng đường dây với dịch vụđiện thoại thông thường vì nó sử dụng dải tần cao hơn tín hiệu thoại. Tốc độ download của DSL lên tới hàng chục Mbps, phụ thuộc vào công nghệ, điều kiện đường dây và mức độ dịch vụ. Tốc độ upload thường chậm hơn download đối với công nghệ ADSL (Asymmetric DSL). - Cable Modem: Là loại dịch vụ truyền thông trên hệ thống hạ tầng cáp truyền hình. Có tốc độ khá cao, nhưng chi phí cao và không phố biến rộng. - T1: Là một dịch vụ băng rộng tốc độ cao, lên tới 1.544 Mbps, thường được sử dụng cho các tổ chức, doanh nghiệp. Chi phí thiết lập dịch vụđắt, chi phí thuê bao hàng tháng tùy theo khoảng các. - Internet vệ tinh (Satellite): Là dịch vụ dành cho các vùng không có khả năng thiết lập các kết nối mặt đất như DSL hoặc Cable Internet. Dịch vụ này thường gặp phải một số vấn đề như trễ tín hiệu hoặc ảnh hưởng bởi thời tiết. 4.2 Mạng và xử lý phân tán Định nghĩa mạng máy tính: Các hệ thống máy tính được kết nối với nhau thông qua các phương tiện truyền dẫn, các thiết bị mạng, và phần mềm. Các mô hình xử lý trong mạng máy tính Xử lý tập trung (Centralized Processing) 55
  59. Việc xử lý được thực hiện tại 1 máy tính hoặc 1 hệ thống máy tính gộp (cluster) tại một nơi duy nhất. Việc truy cập tới máy tính xử lý có thể thông qua các trạm cuối không thông minh, chỉ có chức năng gửi đầu vào và nhận kết quảđầu ra, hoặc thông qua các trạm cuối thông minh hơn, có khả năng xử lý định dạng đầu ra. Tất cả công việc xử lý đều được thực hiện tại máy tính trung tâm. Hình 4.3 Xử lý tập trung với trạm cuối không thông minh Khi máy tính cá nhân và mạng cục bộ phát triển, các trạm cuối được thay thế bởi các máy tính cá nhân, có chức năng như trạm cuối nhưng có thêm các thiết bị phần cứng và phần mềm khác. Người dùng máy tính cá nhân có thể chạy các ứng dụng của riêng mình đồng thời cũng vẫn có thể truy cập vào máy tính trung tâm khi cần. Hình 4.4 Xử lý tập trung với trạm cuối thông minh hơn Tới những năm 1990s, mô hình client/server ra đời và dần thay thế các hệ thống truy nhập trạm cuối. Máy khách (client) kết nối với máy chủ thông qua hệ thống mạng thay vì các trạm cuối được nối trực tiếp tới máy xử lý trung tâm. 56
  60. Hình 4.5 Mô hình Client/Server Xử lý rời rạc (Decentralized Processing) Là mô hình xử lý được thực hiện tại nhiều máy đặt tại các nơi khác nhau. Mặc dù dữ liệu được truyền giữa các máy tính theo định kỳđể phối hợp xử lý, nhưng với tần suất không liên tục. Xử lý phân tán (Distributed Processing) Mô hình sử dụng các hệ thống máy tính đặt ở xa nhưng kết nối với nhau qua mạng để giải quyết một vấn đề hoặc xử lý thông tin. Một hệ thống phân tán bao gồm nhiều máy tính độc lập, được kết nối với nhau qua mạng và được trang bị các phần mềm hệ thống phân tán. Phần mềm này sẽ cho phép các máy tính kết hợp hoạt động và chia sẻ tài nguyên phần cứng, phần mềm, dữ liệu .v.v. Người dùng của hệ thống phân tán sẽ chỉ tương tác với một giao diện duy nhất mặc dù việc xử lý có thểđược thực hiện bởi các hệ thống máy tính đặt ở các nơi xa nhau. 4.3 Các giao thức và phần mềm truyền thông Giao thức truyền thông: Các luật và các tiêu chuNn cần thiết để đảm bảo việc truyền thông có thể thực hiện được. Phần mềm truyền thông: Là các phần mềm cung cấp các chức năng quan trọng trong mạng, cho phép người dùng và các hệ thống có thể trao đổi thông tin và dữ liệu qua mạng. Hệđiều hành mạng: Là hệđiều hành có các thành phần và các chương trình cho phép máy tính kết nối mạng và tiếp nhận các yêu cầu từ các máy tính khác về dữ liệu và điều khiển việc truy cập tới các tài nguyên như máy in hoặc hệ thống tệp. Phần mềm quản lý mạng: Phần mềm dùng để giám sát hoạt động của các hệ thống máy tính trong mạng và các tài nguyên được chia sẻ. Một số giao thức truyền thông thông dụng 57
  61. - Mô hình OSI (Open Systems Interconnection): Giao thức này phân chia các chức năng truyền thông ra thành 7 tầng khác nhau để làm đơn giản hóa việc phát triển, vận hành, và bảo trì các mạng truyền thông phức tạp. - TCP/IP (Transmission Control Protocol / Internet Protocol): Giao thức truyền thông nguyên thủy của Internet, ra đời vào những năm 1970s. Tương tự như OSI nhưng chỉ chia thành 4 tầng. - SNA (System Network Architecture): Giao thức truyền thông được phát triển và sử dụng trên các máy tính của IBM. Hiện nay SNA vẫn được sử dụng trong một số ngân hàng và mạng giao dịch tài chính. - Ethernet: Giao thức truyền thông rất phổ biến được sử dụng cho các mạng cục bộđể đảm bảo tính thống nhất và tương thích giữa các thiết bị truyền thông, nhờđó nhiều người dùng có thể dễ dàng sử dụng 1 sợi cáp theo tiêu chuNn để kết nối thiết bị, chia sẻ tài nguyên. - ATM (Asyschronous Transfer Mode): Công nghệ chuyển mạch chia bản tin thành các tế bào có kích thước cốđịnh 53 bytes, có thể hỗ trợ tốc độ truyền lên tới 10 Gbps. - 802.11a: ChuNn không dây cho phép kết nối các thiết bị ATM không dây với tốc độ lên tới 54 Mbps. - Bluetooth: ChuNn không dây cho phép kết nối các thiết bịđiện thoại di động, máy tính cầm tay, và các thiết bị di động khác trong khoảng cách ngắn. - 802.11b/Wifi: ChuNn không dây cho phép kết nối các thiết bị không dây với khoảng cách xa hơn. 4.4 Sơ lược về chức năng và hoạt động của Internet Internet là một mạng của các mạng, có phạm vi trên toàn cầu. Phần lõi của Internet có thể được xem như là một mạng lưới các thiết bị mạng là Router kết nối với nhau và có chức năng chọn đường, chuyển tiếp các gói tin đi tới đích. Để có thể kết nối tới Internet, người sử dụng (cá nhân hoặc tổ chức) phải thiết lập kết nối tới một nhà cung cấp dịch vụ Internet (ISP - Internet Service Provider) thông qua các kỹ thuật như quay số (dial-up), DSL, đường truyền riêng Các ISP có kết nối tới các ISP mức cao hơn và qua đó kết nối vào mạng lõi của Internet. Các bản tin từ trạm gửi sẽđược chuyển tiếp qua các Router của ISP mà trạm kết nối vào và có thể sẽ chuyển qua các ISP khác cho tới khi đến trạm nhận thông tin. 58
  62. Hình 4.6 Truyền dữ liệu trên Internet Hoạt động của Internet Hoạt động của Internet dựa trên bộ giao thức nổi tiếng là TCP/IP, trong đó có 2 giao thức chính được lấy làm tên gọi của bộ giao thức là TCP (Transmission Control Protocol) và IP (Internet Protocol). Internet Protocol (IP): Là giao thức chính ở tầng liên mạng của mô hình TCP/IP. IP có nhiệm vụ truyền tải các gói tin từ trạm nguồn tới trạm đích dựa trên địa chỉ của trạm. Để làm được việc này, IP định nghĩa phương pháp đánh địa chỉ (gọi là lược đồ địa chỉ IP), và cấu trúc của gói tin. Phiên bản đầu tiên của địa chỉ IP gọi là IPv4 hiện đang được dùng chính trên Internet. Mặc dù vậy, IPv4 có một số hạn chế và phiên bản tiếp theo IPv6 đang được triển khai thay thế dần phiên bản cũ. Transmission Control Protocol (TCP): Là một trong 2 giao thức chính của bộ giao thức TCP/IP. Trong khi giao thức IP điều khiển việc truyền dữ liệu ở cấp độ thấp hơn, từ trạm tới trạm thông qua việc chuyển tiếp các gói tin qua mạng Internet thì TCP hoạt động ở cấp độ cao hơn, liên quan tới việc truyền thông giữa 2 hệ thống cuối, 2 tiến trình trên các trạm, chẳng hạn giữa trình duyệt Web và Web server. Nói cách khác, TCP cung cấp một tiến trình truyền thông tin cậy, có thứ tự, từ một chương trình trên một trạm này tới một chương trình trên một trạm khác. Bên cạnh ứng dụng Web, TCP còn được sử dụng cho nhiều ứng dụng khác, điển 59
  63. hình là email, truyền tệp .v.v. TCP cũng có chức năng phát hiện lỗi, điều khiển khiển luồng, điều khiển tắc nghẽn. Uniform Resource Locator (URL): URL được sử dụng để định vị một tài nguyên trên mạng Internet và cơ chếđể thu thập nó. Về căn bản, URL thường có 3 phần là giao thức, tên miền hoặc địa chỉ IP của trạm chứa tài nguyên, và đường dẫn đến tài nguyên. protocol://domain/pathname Ví dụ: Tên miền (Domain name): Để thay thế cho các địa chỉ IP khó nhớ trong việc định danh một trạm trên mạng, tên miền được sử dụng. Để phân cấp, tên miền được tổ chức dưới dạng các cấp độ (levels). Cấp độ đầu tiên là top-level domains, bao gồm generic top-level domain như com, net, org .v.v và country code top-level domains phân biệt theo quốc gia. Bên dưới cấp độ đầu tiên là các tên miền cấp độ 2 và 3 thường được dùng để dành cho người dùng cuối kết nối các hệ thống mạng của họ tới Internet, thiết lập các Web site, hoặc tạo ra các tài nguyên khác có thểđược truy cập qua Internet. Hình 4.7 Top-level domain Kết nối và truy cập tới Internet Để truy cập tới Internet thì phải thiết lập kết nối thông qua nhà cung cấp dịch vụ Internet (ISP). Sau đây là một số phương pháp kết nối thông dụng: -Kết nối thông qua mạng cục bộ: Từ mạng cục bộ của người dùng (thường là tổ chức), có thể thiết lập kết nối tới mạng của ISP bằng một kênh truyền riêng qua 1 Router. -Kết nối thông qua modem từ máy tính cá nhân: Đối với người dùng cá nhân, thông dụng hơn cả là phương pháp kết nối bằng mạng công cộng thông qua 1 modem. -Kết nối thông qua dịch vụ online: Người sử dụng kết nối tới máy chủ của nhà cung cấp dịch vụ online. 60
  64. Hình 4.8 Kết nối và truy cập tới Internet Các ISP điển hình tại Việt Nam: Tại Việt Nam hiện nay có khoảng gần 20 ISP, điển hình là các ISP sau: STT Tên ISP Web site Công ty Cổ phần dịch vụ Bưu chính Viễn thông www.spt.com.vn 1 Sài Gòn (SaigonPostel) www.fpt.vn 2 Công ty Cổ phần Viễn thông FPT (FPT Telecom) www.netnam.com.vn 3 Công ty NetNam Tập đoàn Bưu chính Viễn thông Việt www.vnpt.com.vn 4 Nam (VNPT) www.viettel.com.vn 5 Tổng công ty Viễn thông Quân đội (Viettel) 4.5 Các dịch vụ truyền thông và Internet Internet cung cấp vô số các dịch vụ rất hữu ích cho người sử dụng cũng như những nhà phát triển, sau đây là một số dịch vụ phổ biến trên Internet : 61
  65. - Email : Thưđiện tử là dịch vụ rất tiện lợi cho người dùng, cho phép trao đổi các thông tin dạng file text, âm thanh, hình ảnh, file dữ liệu .v.v giữa người dùng Internet 1 cách nhanh chóng. -Trao đổi trực tuyến : Cho phép hai hoặc nhiều người có thể trao đổi trực tiếp theo thời gian thực qua mạng Internet. - Telnet : Dịch vụđăng nhập từ xa cho phép người dùng truy cập vào 1 máy tính khác ở xa qua mạng và sử dụng các tài nguyên được phép. Chẳng hạn người dùng có thểđăng nhập vào máy tính ở cơ quan từ một địa điểm ở xa nhưở nhà hoặc ở nơi làm việc khác. - FTP (File Transfer Protocol): Dịch vụ truyền file cho phép chuyển các file từ máy này đến máy khác qua mạng Internet. - Chat rooms : Tạo môi trường để nhiều người dùng có thể trao đổi trực tuyến. - Internet phone : Cho phép người dùng Internet sử dụng các phần mềm và thiết bị tương thích để trao đổi với nhau bằng giọng nói qua mạng. Một số hệ thống cho phép trao đổi giữa giữa người dùng phần mềm trên máy tính và người dùng điện thoại (PC- to-Phone). - Internet Video Conferencing : Dịch vụ hỗ trợ giao tiếp trực tiếp bằng hình ảnh và âm thanh giữa nhiều người dùng Internet. - Content Streaming : Cho phép người dùng truyền các file đa phương tiện qua mạng, nhờđó các dòng dữ liệu âm thanh và hình ảnh được hiển thị gần như liên tục trong khi nội dung còn lại vẫn đang tiếp tục được truyền đi. - Mua bán qua mạng : Cho phép người dùng mua bán các sản phNm và dịch vụ qua Internet. - Đấu giá trên mạng : Dịch vụ tổ chức các phiên đấu giá qua Web cho người dùng trên khắp thế giới tham gia. - Music, radio, video qua mạng : Cho phép người dùng nghe, xem hoặc tải âm nhạc, video qua mạng. -Trao đổi dữ liệu điện tử (EDI - Electronic Data Interchange) : Cho phép các tổ chức, doanh nghiệp trao đổi dữ liệu nghiệp vụ và thương mại dưới dạng dữ liệu điện tử và theo một định dạng chuNn, có cấu trúc được thống nhất giữa 2 bên. Lợi ích chính của EDI là làm giảm chi phí đáng kể so với phương pháp trao đổi thủ công, thông qua giấy tờ. Thậm chí kể cả khi các giấy tờđược duy trì sử dụng song song, EDI vẫn đem lại nhiều lợi ích khác như tốc độ nhanh hơn, giảm các chi phí như sắp xếp, tổ chức, phân 62
  66. phối, tìm kiếm tài liệu .v.v. Một ưu điểm nữa của EDI là giảm các lỗi trong quá trình trao đổi dữ liệu chẳng hạn lỗi trong quá trình vận chuyển .v.v. -Mạng công cộng và các dịch vụ chuyên biệt : Cung cấp cho người dùng khả năng truy cập tới khối dữ liệu khổng lồ và các dịch vụ khác. - Đào tạo qua mạng : Cho phép tổ chức các lớp học ảo qua hệ thống mạng hoặc cung cấp các bài giảng dạng điện tử trên mạng. Hình 4.9 Trao đổi dữ liệu điện tử World Wide Web (Web) Web là một hệ thống các tài liệu siêu văn bản có liên liên kết với nhau và có thểđược truy cập thông qua Internet. Sử dụng trình duyệt Web (Web browser), người dùng có thể xem các trang Web chứa văn bản, hình ảnh, video, và các dạng thức khác và có thể chuyển qua giữa các trang này bằng các siêu liên kết. Có thể nói, Web là một dịch vụ Internet bao gồm hàng triệu máy tính độc lập nhưng làm việc cùng với nhau như một khối thống nhất. Web site : Là một tập các trang web, hình ảnh, video, hoặc các tài nguyên số khác có quan hệ với nhau, được gắn địa chỉ với 1 tên miền hoặc 1 địa chỉ IP. Một web site được lưu trữ trên máy chủ web và có thể truy cập qua Internet. 63
  67. Hypermedia : Là khái niệm mở rộng của siêu văn bản (hypertext), trong đó các dạng thức dữ liệu như văn bản, hình ảnh, audio, video, và các siêu liên kết được bố trí với nhau để tạo thành một dạng thông tin hỗn hợp. Thông tin hỗn hợp này có thểđược tạo ra bằng cách sử dụng một ngôn ngữđánh dấu siêu văn bản là HTML và sau đó được hiển thị bởi các chương trình phần mềm gọi là các trình duyệt Web. HTML (HyperText Markup Language) : Ngôn ngữđánh dấu siêu văn bản - là ngôn ngữ được dùng để tạo ra các trang web. Ngôn ngữ này cung cấp phương thức để tạo ra một tài liệu có cấu trúc bằng cách chỉ ra các ngữ nghĩa cấu trúc của văn bản như tiêu đề, đoạn văn bản, danh sách liệt kê, siêu liên kết đến văn bản khác, và các hạng mục khác. Nó cũng cho phép hình ảnh và các đối tượng khác được nhúng vào trang web và có thểđược dùng để tạo ra các form tương tác. HTML được viết dưới dạng các thành tố HTML bao gồm các thẻđược bao bởi một cặp ngoặc nhọn ( ), nằm trong trang web. Các thành tố HTML đóng vai trò như các chỉ dẫn cho trình duyệt web biết tài liệu được phiên dịch như thế nào và hiển thị trên màn hình ra sao. Search Engine (SE): Máy tìm kiếm là công cụđược thiết kếđể thực hiện tìm kiếm thông tin trên Internet. Kết quả tìm kiếm thường được hiển thị dưới dạng danh sách các tài nguyên tìm được, có thể là các trang web, hình ảnh, thông tin, hoặc các dạng thức khác. Khác với các thư mục Web được duy trì thủ công bởi người dùng, các SE hoạt động một các tựđộng thông qua các thuật toán được cài đặt bởi người dùng hoặc kết hợp tựđộng và thủ công. Để làm được việc này, các SE phải lưu trữ thông tin về rất nhiều trang web, lấy từ chính các trang html. Các trang này được thu thập thông qua các phần mềm web crawler (spider), một dạng trình duyệt web tựđộng lần theo các liên kết trên trang web. Nội dung trang web sau đó được phân tích và xác định xem sẽđánh chỉ mục (index) nó như thế nào. Dữ liệu về các trang web được chứa trong CSDL chỉ mục để sử dụng cho việc truy vấn sau này. Khi người sử dụng gửi một truy vấn tới SE (thường sử dụng từ khóa), SE sẽ kiểm tra CSDL chỉ mục và cung cấp danh sách các trang web khớp nhất với truy vấn của người dùng. Java Applets : Là một chương trình được viết bằng ngôn ngữ Java có thể nhúng vào các trang html thông qua thẻ theo cách tương tự như nhúng các hình ảnh vào trang web. Khi người dùng sử dụng trình duyệt web có hỗ trợ Java để xem trang web có chứa applet, mã của applet sẽđược tải về hệ thống của người sử dụng và được thực hiện bởi máy ảo Java (Java Virtual Machine) của trình duyệt. Thông thường Java applet được sử dụng để cung cấp các tính năng tương tác cho ứng dụng web mà html không làm được. Hiện nay, ngoài Java applet còn một số loại đối tượng khác cung cấp tính năng tương tác cũng có thể nhúng vào trang web, ví dụ các đối tượng được tạo ra bằng các công cụ như Multimedia Flash .v.v. 64