Giáo trình hệ quản trị cơ sở dữ liệu SQL

145 trang vanle 7870 Free

Download

Bạn đang xem 20 trang mẫu của tài liệu "Giáo trình hệ quản trị cơ sở dữ liệu SQL", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

giao_trinh_he_quan_tri_co_so_du_lieu_sql.pdf

Nội dung text: Giáo trình hệ quản trị cơ sở dữ liệu SQL

Giáo trình hệ quản trị cơ sở dữ liệu SQL - ĐHCNHN Biên tập bởi: Tổ HTTT Đại học Công nghiệp Hà Nội
Giáo trình hệ quản trị cơ sở dữ liệu SQL - ĐHCNHN Biên tập bởi: Tổ HTTT Đại học Công nghiệp Hà Nội Các tác giả: Tổ HTTT Đại học Công nghiệp Hà Nội Phiên bản trực tuyến:
MỤC LỤC 1. Tổng quan về DBMS và SQL sever 2. Ngôn ngữ định nghĩa dữ liệu 3. Ngôn ngữ thao tác dữ liệu 3.1. Ngôn ngữ thao tác dữ liệu 3.2. Phép nối 4. Làm việc với View ( khung nhìn ) 5. Bảo mật trong SQL 6. Thủ tục lưu trữ , hàm và trigger 6.1. Thủ tục lưu trữ 6.2. Hàm và trigger 7. Giao dịch SQL 8. Phụ lục Giao trinh He quan tri CSDL-SQL Tham gia đóng góp 1/143
Tổng quan về DBMS và SQL sever Tổng quan về DBMS và SQL Sever Chương này trình bày một cách nhìn khái quát về cơ sở dữ liệu (CSDL/DB), về hệ quản trị cơ sở dữ liệu (HQTCSDL/DBMS) và về hệ cơ sở dữ liệu (HCSDL/DBS). Các đòi hỏi khi xây dựng một HQTCSDL đó cũng chính là những chức năng mà một HCSDL cần phải có. Trong chương này chúng tôi cũng muốn giới thiệu tổng quan về ngôn ngữ hỏi có cấu trúc (SQL) và các hệ quản trị cơ sở dữ liệu quan hệ là một trong những nền tảng kỹ thuật quan trọng trong công nghiệp máy tính. Cho đến nay, có thể nói rằng SQL đã được xem là ngôn ngữ chuẩn trong cơ sở dữ liệu. Các hệ quản trị cơ sở dữ liệu quan hệ thương mại hiện có như Oracle, SQL Server, Informix, DB2, đều chọn SQL làm ngôn ngữ cho sản phẩm của mình Vậy thực sự SQL là gì? Tại sao nó lại quan trọng trong các hệ quản trị cơ sở dữ liệu? SQL có thể làm được những gì và như thế nào? Nó được sử dụng ra sao trong các hệ quản trị cơ sở dữ liệu quan hệ? Chương này sẽ cung cấp cho chúng ta cái nhìn tổng quan về SQL và một số vấn đề liên quan. Ta tìm hiểu DBMS trên một HQCSDL cụ thể: SQL Server 2000. Do vậy chương này giới thiệu cài đặt SQL Server 2000 và các thành phần của nó, giúp chúng ta chủ động khai thác trong nắm bắt và tạo lập ứng dụng. Tổng quan về DBMS MỘT SỐ KHÁI NIỆM Một cơsở dữ liệu - CSDL(DataBase): Là một kho dữ liệu được tổ chức theo một nguyên tắc nào đó. Đó là một tập hợp các tập tin có liên quan với nhau, được thiết kế nhằm làm giảm thiểu sự dư thừa dữ liệu, đảm bảo tính tin cậy khi truy xuất dữ liệu. Các tập tin này chứa các thông tin biểu diễn các đối tượng trong một ứng dụng thế giới thực. CSDL lưu giữ thông tin của một trường đại học như : khoa, giảng viên, sinh viên, khóa học, Thông thường, một cơ sở dữ liệu sẽ bao trùm tất cả các thông tin của một ứng dụng, không nên đặt hai cơ sở dữ liệu vào một ứng dụng. Hệ quản trị cơ sở dữ liệu DBMS(DataBaseManagement System): là một hệ thống gồm một CSDL và các thao tác trên CSDL. Đó là hệ thống chương trình, công cụ cho 2/143
phép quản lý và tương tác với CSDL. Trên đó người dùng có thể định nghĩa, thao tác, và xử lí dữ liệu trong một CSDL để xuất ra những thông tin có nghĩa. Ví dụ 1-5 : một DBMS có thể quản trị cơ sở dữ liệu của một trường đại học cũng như những cơ sở dữ liệu có ý nghĩa khác như : cơ sở dữ liệu phục vụ tổng thu nhập quốc gia, một cơ sở dữ liệu liên hợp quốc về dữ liệu địa lý thế giới,v v - Một hệ cơ sở dữ liệu (HCSDL/ DBS: DataBase System) là một phần mềm cho phép xây dựng một HQTCSDL. Các vấn đề cần xử lý của hệ cơ sở dữ liệu Một số điểm bất lợi chính của việc lưu giữ thông tin có tổ chức trong hệ thống xử lý file thông thường mà hệ HCSDL cần lưu ý: • Dư thừa dữ liệu và tính không nhất quán (Data redundancy and inconsistency) : Do các file và các trình ứng dụng được tạo ra bởi các người lập trình khác nhau, nên các file có định dạng khác nhau, các chương trình được viết trong các ngôn ngữ lập trình khác nhau, cùng một thông tin có thể được lưu giữ trong các file khác nhau. Tính không thống nhất và dư thừa này sẽ làm tăng chi phí truy xuất và lưu trữ, hơn nũa, nó sẽ dẫn đến tính không nhất quán của dữ liệu: các bản sao của cùng một dữ liệu có thể không nhất quán . • Khó khăn trong việc truy xuất dữ liệu: Môi trường của hệ thống xử lý file thông thường không cung cấp các công cụ cho phép truy xuất thông tin một cách hiệu quả và thuận lợi. • Sự cô lập dữ liệu(Data isolation) : Các giá trị dữ liệu được lưu trữ trong cơ sở dữ liệu phải thoả mãn một số các ràng buộc về tính nhất quán của dữ liệu ( ràng buộc nhất quán / consistency contraints ). Trong hệ thống xử lý file thông thường, rất khó khăn trong việc thay đổi các chương trình để thoả mãn các yêu cầu thay đổi ràng buộc. Vấn đề trở nên khó khăn hơn khi các ràng buộc liên quan đến các hạng mục dữ liệu nằm trong các file khác nhau. • Các vấn đề về tính nguyên tử (Atomicity problems): Tính nguyên tử của một hoạt động (giao dịch) là: hoặc nó được hoàn tất trọn vẹn hoặc không có gì cả . Điều này có nghĩa là một hoạt động (giao dịch) chỉ làm thay đổi các dữ liệu bền vững khi nó đã hoàn tất (kết thúc thành công) nếu không, giao dịch không để lại một dấu vết nào trên CSDL. Trong hệ thống xử lý file thông thường khó đảm bảo được tính chất này. 3/143
• Tính bất thường trong truy xuất cạnh tranh : Một hệ thống cho phép nhiều người sử dụng cập nhật dữ liệu đồng thời, có thể dẫn đến kết quả là dữ liệu không nhất quán. Điều này đòi hỏi một sự giám sát. Hệ thống xử lý file thông thường không cung cấp chức năng này. • Vấn đề an toàn (Security problems): một người sử dụng hệ cơ sở dữ liệu không cần thiết và cũng không có quyền truy xuất tất cả các dữ liệu. Vấn đề này đòi hỏi hệ thống phải đảm bảo được tính phân quyền, chống truy xuất trái phép Các bất lợi nêu trên đã gợi mở sự phát triển các DBMS. Phần sau của giáo trình sẽ đề cập đến các quan niệm và các thuật toán được sử dụng để phát triển một hệ cơ sở dữ liệu nhằm giải quyết các vấn đề nêu trên . Hầu hết các hệ quản trị CSDL đều thực hiện các chức năng sau : Lưu trữ dữ liệu Tạo ra và duy trìCSDL Cho phép nhiềungười dùngtruy xuất đồngthời Hỗ trợ tính bảo mật và riêng tư Cho phép xem và xử lý dữ liệu lưu trữ Cho phép cập nhật và lưu trữ dữ liệu sau khi cập nhật Cung cấp một cơ chế chỉ mục (index) hiệu quả để truy cập nhanh các dữ liệu lựa chọn Cung cấp tính nhất quán giữa các bản ghi khác nhau Bảo vệ dữ liệu khỏi mất mát bằng các quá trình sao lưu (backup) và phục hồi (recovery). Tổng quan về cơ sở dữ liệu quan hệ Mô hình dữ liệu quan hệ Mô hình dữ liệu quan hệ được Codd đề xuất năm 1970 và đến nay trở thành mô hình được sử dụng phổ biến trong các hệ quản trị cơ sở dữ liệu thương mại. Nói một cách đơn giản, một cơ sở dữ liệu quan hệ là một cơ sở dữ liệu trong đó tất cả dữ liệu được tổ chức trong các bảng có mối quan hệ với nhau. Mỗi một bảng bao gồm các dòng và các cột: mỗi một dòng được gọi là một bản ghi (bộ) và mỗi một cột là một trường (thuộc tính). Hai hay nhiều bảng có thể có liên kết nếu chúng có một hay nhiều trường chung) Hình 1.1 minh hoạ cho ta thấy được 3 bảng trong một cơ sở dữ liệu 4/143
Các bảng trong một cơ sở dữ liệu Bảng (Table) Như đã nói ở trên, trong cơ sở dữ liệu quan hệ, bảng là đối tượng được sử dụng để tổ chức và lưu trữ dữ liệu. Một cơ sở dữ liệu bao gồm nhiều bảng và mỗi bảng được xác định duy nhất bởi tên bảng. Một bảng bao gồm một tập các dòng và các cột: mỗi một dòng trong bảng biểu diễn cho một thực thể (trong hình 1.1, mỗi một dòng trong bảng SINHVIEN tương ứng với một sinh viên), và mỗi một cột biểu diễn cho một tính chất của thực thể (chẳng hạn cột NGAYSINH trong bảng SINHVIEN biểu diễn cho ngày sinh của các sinh viên được lưu trữ trong bảng). Như vậy, liên quan đến mỗi một bảng bao gồm các yếu tố sau: • Tên của bảng: được sử dụng để xác định duy nhất mỗi bảngn trong cơ sở dữ liệu. • Cấu trúc của bảng: Tập các cột trong bảng. Mỗi mộtcột trong bảng được xác định bởi một tên cột và phải có một kiểu dữ liệu nào đó (chẳng hạn cột NGAYSINH trong bảng SINHVIEN ở hình 1.1 có kiểu là DATETIME). Kiểu dữ liệu của mỗi cột qui định giá trị dữ liệu có thể được chấp nhận trên cột đó. • Dữ liệu của bảng: Tập các dòng (bản ghi) hiện có trong bảng. 5/143
Khoá của bảng Trong một cơ sởdữ liệu được thiết kế tốt, mỗi một bảng phải có một hoặc một tập các cột mà giá trị dữ liệu của nó xác định duy nhất một dòng trong một tập các dòng của bảng. Tập một hoặc nhiều cột có tính chất này được gọi là khoá của bảng. Việc chọn khoá của bảng có vai trò quan trọng trong việc thiết kế và cài đặt các cơ sở dữ liệu quan hệ. Các dòng dữ liệu trong một bảng phải có giá trị khác nhau trên khoá. Bảng MONHOC trong hình dưới đây có khoá là cột MAMONHOC Bảng MONHOC với khoá chính là MAMONHOC Một bảng có thể có nhiều tập các cột khác nhau có tính chất của khoá (tức là giá trị của nó xác định duy nhất một dòng dữ liệu trong bảng). Trong trường hợp này, khoá được chọn cho bảng được gọi là khoá chính (primary key) và những khoá còn lại được gọi là khoá phụ hay là khoá dự tuyển (candidate key/unique key). Mối quan hệ và khoá ngoài Các bảng trong một cơ sở dữ liệu không tồn tại độc lập mà có mối quan hệ mật thiết với nhau về mặt dữ liệu. Mối quan hệ này được thể hiện thông qua ràng buộc giá trị dữ liệu xuất hiện ở bảng này phải có xuất hiện trước trong một bảng khác. Mối quan hệ giữa các bảng trong cơ sở dữ liệu nhằm đàm bảo được tính đúng đắn và hợp lệ của dữ liệu trong cơ sở dữ liệu. Trong hình 1.3, hai bảng LOP và KHOA có mối quan hệ với nhau. Mối quan hệ này đòi hỏi giá trị cộtMAKHOA của một dòng (tức là một lớp)trong bảng LOP phải được xác định từ cột MAKHOA của bảng KHOA. 6/143
Mối quan hệ giữa hai bảng LOP và KHOA trong cơ sở dữ liệu Mối quan hệ giữa các bảng trong một cơ sở dữ liệu thể hiện đúng mối quan hệ giữa các thực thể trong thế giới thực. Trong hình 1.3, mối quan hệ giữa hai bảng LOP và KHOA không cho phép một lớp nào đó tồn tại mà lại thuộc vào một khoa không có thật. Khái niệm khoá ngoài (Foreign Key) trong cơ sở dữ liệu quan hệ được sử dụng để biểu diễn mối quan hệ giữa các bảng dữ liệu. Một hay một tập các cột trong một bảng mà giá trị của nó được xác định từ khóa chính của một bảng khác được gọi là khoá ngoài. Trong hình 1.3, cột MAKHOA của bảng LOP được gọi là khoá ngoài của bảng này, khoá ngoài này tham chiếu đến khoá chính của bảng KHOA là cột MAKHOA. Giới Thiệu SQL Server 2000 SQL Server 2000 là một hệ thống quản trị cơ sở dữ liệu quan hệ (Relational Database Management System (RDBMS) ) sử dụng Transact-SQL để trao đổi dữ liệu giữa Client computer và SQL Server computer. Một RDBMS bao gồm databases, database engine và các ứng dụng dùng để quản lý dữ liệu và các bộ phận khác nhau trong RDBMS. SQL Server 2000 được tối ưu để có thể chạy trên môi trường cơ sở dữ liệu rất lớn (Very Large Database Environment) lên đến Tera-Byte và có thể phục vụ cùng lúc cho hàng ngàn user. SQL Server 2000 có thể kết hợp "ăn ý" với các server khác như Microsoft InternetInformation Server (IIS), E-Commerce Server, Proxy Server SQL Server có 7 editions - Enterprise : Chứa đầy đủ các đặc trưng của SQL Server và có thể chạy tốt trên hệ thống lên đến 32 CPUs và 64 GB RAM. Thêm vào đó nó có các dịch vụ giúp cho việc phân tích dữ liệu rất hiệu quả (Analysis Services) 7/143
- Standard : Rất thích hợp cho các công ty vừa và nhỏ vì giá thành rẻ hơn nhiều so với Enterprise Edition, nhưng lại bị giới hạn một số chức năng cao cấp (advanced features) khác, edition này có thể chạy tốt trên hệ thống lên đến 4 CPU và 2 GB RAM. - Personal: được tối ưu hóa để chạy trên PC nên có thể cài đặt trên hầu hết các phiên bản windows kể cả Windows 98. - Developer : Có đầy đủ các tính năng của Enterprise Edition nhưng được chế tạo đặc biệt như giới hạn số lượng người kết nối vào Server cùng một lúc Ðây là edition mà các bạn muốn học SQL Server cần có. Chúng ta sẽ dùng edition này trong suốt khóa học. Edition này có thể cài trên Windows 2000 Professional hay Win NT Workstation. - Desktop Engine (MSDE): Ðây chỉ là một engine chạy trên desktop và không có user interface (giao diện). Thích hợp cho việc triển khai ứng dụng ở máy client. Kích thước database bị giới hạn khoảng 2 GB. - Win CE : Dùng cho các ứng dụng chạy trên Windows CE - Trial: Có các tính năng của Enterprise Edition, download free, nhưng giới hạn thời gian sử dụng. Cài Ðặt SQL Server 2000 (Installation) Ta cần có Developer Edition và ít nhất là 64 MB RAM, 500 MB hard disk để có thể install SQL Server. Có thể install trên Windows Server hay Windows XP Professional, Windows 2000 Professional hay NT Workstation nhưng không thể install trên Win 98 family. Khi install cần lưu ý các điểm sau: Ở màn hình thứ hai bạn chọn Install Database Server. Sau khi install xong SQL Server bạn có thể install thêm Analysis Service nếu thích. Ở màn hình Installation Definition chọn Server and Client Tools. Sau đó nên chọn kiểu Customvà chọn tất cảcác bộ phận của SQL Server. Ngoài ra nên chọn các giá trị mặc định (default) Ở màn hình Authentication Mode nhớ chọn Mixed Mode. Lưu ý vì SQL Server có thể dùng chung chế độ bảo mật (security) với Win NT và cũng có thể dùng chế độ bảo mật riêng của nó. Trong Production Server người ta thường dùng Windows Authetication vì độ an toàn cao hơn và dễ dàng cho người quản lý mạng và cả cho người sử dụng. Nghĩa là một khi bạn được chấp nhận (authenticated) kết nối vào domain thì bạn có quyền truy 8/143
cập dữ liệu (access data) trong SQL Server. Tuy nhiên ta nên chọn Mixed Mode để dễ dàng cho việc học tập. Sau khi install bạn sẽ thấy một icon nằm ở góc phải bên dưới màn hình, đây chính là Service Manager. Có thể Start, Stop các SQL Server services dễ dàng bằng cách double- click vào icon này. Một chút kiến thức về các Version của SQL Server SQL Server của Microsoft được thị trường chấp nhận rộng rãi kể từ version 6.5. Sau đó Microsoft đã cải tiến và hầu như viết lại một engine mới cho SQL Server 7.0. Cho nên có thể nói từ version 6.5 lên version 7.0 là một bước nhảy vọt. Có một số đặc tính của SQL Server 7.0 không tương thích với version 6.5. Trong khi đó từ Version 7.0 lên version 8.0 (SQL Server 2000) thì những cải tiến chủ yếu là mở rộng các tính năng về web và làm cho SQL Server 2000 đáng tin cậy hơn. Một điểm đặc biệt đáng lưu ý ở version 2000 là Multiple-Instance. Nói cho dễ hiểu là bạn có thể install version 2000 chung với các version trước mà không cần phải uninstall chúng. Nghĩa là bạn có thể chạy song song version 6.5 hoặc 7.0 với version 2000 trên cùng một máy (điều này không thể xảy ra với các version trước đây). Khi đó version cũ trên máy bạn là Default Instance còn version 2000 mới vừa install sẽ là Named Instance. Các thành phần quan trọng trong SQL Server 2000 SQL Server 2000 được cấu tạo bởi nhiều thành phần như Relational Database Engine, Analysis Service và English Query Các thành phần này khi phối hợp với nhau tạo thành một giải pháp hoàn chỉnh giúp cho việc lưu trữ và phân tích dữ liệu một cách dễ dàng Relational Database Engine - Cái lõi của SQL Server: Ðây là một engine có khả năng chứa data ở các quy mô khác nhau dưới dạng table và support tất cả các kiểu kết nối (data connection) thông dụng của Microsoft như ActiveX Data Objects (ADO), OLE DB, and Open Database Connectivity (ODBC). Ngoài ra nó còn có khả năng tự điều chỉnh (tune up) ví dụ như sử dụng thêm các tài nguyên (resource) của máy khi cần và trả lại tài nguyên cho hệ điều hành khi một user log off. Replication - Cơ chế tạo bản sao (Replica): Giả sử bạn có một database dùng để chứa dữ liệu được các ứng dụng thường xuyên cập nhật. Khi bạn muốn có một database giống hệt như thế trên một server khác để chạy báo cáo (report database) (cách làm này thường dùng để tránh ảnh hưởng đến performance của server chính). Vấn đề là report server của bạn cũng cần phải được cập nhật thường 9/143
xuyên để đảm bảo tính chính xác của các báo cáo. Ta không thể dùng cơ chế back up and restore trong trường hợp này. Vậy cần xử lý thế nào? Lúc đó cơ chế replication của SQL Server sẽ được sử dụng để bảo đảm cho dữ liệu ở 2 database được đồng bộ (synchronized) Data Transformation Service ( DTS ) - Một dịch vụ chuyển dịch data hiệu quả . Nếu bạn làm việc trong một công ty lớn trong đó data được chứa trong nhiều nơi khác nhau và ở các dạng khác nhau cụ thể như chứa trong Oracle, DB2 (của IBM), SQL Server, Microsoft Access Bạn chắc chắn sẽ có nhu cầu di chuyển data giữa các server này (migrate hay transfer) và không chỉ di chuyển bạn còn muốn định dạng (format) nó trước khi lưu vào database khác, khi đó bạn sẽ thấy DTS giúp bạn giải quyết công việc trên dễ dàng như thế nào. Analysis Service- Một dịch vụ phân tích dữ liệu rất hay của Microsoft Dữ liệu (Data) chứa trong database sẽ chẳng có ý nghĩa gì nhiều nếu như bạn không thể lấy được những thông tin (Information) bổ ích từ đó. Do đó Microsoft cung cấp cho bạn một công cụ rất mạnh giúp cho việc phân tích dữ liệu trở nên dễ dàng và hiệu quả bằng cách dùng khái niệm hình khối nhiều chiều (multi-dimension cubes) và kỹ thuật khai phá dữ liệu (data mining). English Query - Ðây là một dịch vụ giúp cho việc query data bằng tiếng Anh "trơn" (plain English). MetaData Service : Dịch vụ này giúp cho việc chứa đựng và "xào nấu" Meta data dễ dàng hơn. Thế thì Meta Data là cái gì vậy? Meta data là những thông tin mô tả về cấu trúc của data trong database như data thuộc loại nào String hay Integer , một cột nào đó có phải là Primary key hay không Bởi vì những thông tin này cũng được chứa trong database nên cũng là một dạng data nhưng để phân biệt với data "chính thống" người ta gọi nó là Meta Data. Phần này phải xem thêm trong một thành phần khác của SQL Server là SQLServerBooks Online. SQL Server Books Online - Rất hữu dụng và không thể thiếu (được đính kèm theo SQL Server). SQL Server Tools - Ðây là một bộ đồ nghề của người quản trị cơ sở dữ liệu (DBA), gồm: Enterprise Manager - Ðây là một công cụ cho ta thấy toàn cảnh hệ thống cơ sở dữ liệu một cách rất trực quan. Nó rất hữu ích đặc biệt cho người mới học và không thông thạo lắm về SQL. 10/143
Query Analyzer - Ðối với một DBA giỏi thì hầu như chỉ cần công cụ này là có thể quản lý cả một hệ thống database mà không cần đến những thứ khác. Ðây là một môi trường làm việc khá tốt vì ta có thể đánh bất kỳ câu lệnh SQL nào và chạy ngay lập tức đặc biệt là nó giúp cho ta debug stored procedure dễ dàng. SQL Profiler - Nó có khả năng "chụp" (capture) tất cả các sự kiện hay hoạt động diễn ra trên một SQL server và lưu lại dưới dạng text file rất hữu dụng trong việc kiểm soát hoạt động của SQL Server. Ngoài một số công cụ trực quan như trên chúng ta cũng thường hay dùng osql và bcp (bulk copy) trong command prompt. SQL là ngôn ngữ cơ sở dữ liệu quan hệ SQL , viết tắt của Structured Query Language (ngôn ngữ hỏi có cấu trúc), công cụ sử dụng để tổ chức, quản lý và truy xuất dữ liệu đuợc lưu trữ trong các cơ sở dữ liệu. SQL là một hệ thống ngôn ngữ bao gồm tập các câu lệnh sử dụng để tương tác với cơ sở dữ liệu quan hệ. Tên gọi ngôn ngữ hỏi có cấu trúc phần nào làm chúng ta liên tưởng đến một công cụ (ngôn ngữ) dùng để truy xuất dữ liệu trong các cơ sở dữ liệu. Thực sự mà nói, khả năng của SQL vượt xa so với một công cụ truy xuất dữ liệu, mặc dù đây là mục đích ban đầu khi SQL được xây dựng nên và truy xuất dữ liệu vẫn còn là một trong những chức năng quan trọng của nó. SQL được sử dụng để điều khiển tất cả các chức năng mà một hệ quản trị cơ sở dữ liệu cung cấp cho người dùng bao gồm: • Định nghĩa dữ liệu : SQL cung cấp khả năng định nghĩa các cơ sở dữ liệu, các cấu trúc lưu trữ và tổ chức dữ liệu cũng như mối quan hệ giữa các thành phần dữ liệu. • Truy xuất và thao tác dữ liệu : Với SQL, người dùng có thể dễ dàng thực hiện các thao tác truy xuất, bổ sung, cập nhật và loại bỏ dữ liệu trong các cơ sở dữ liệu. • Điều khiển truy cập - SQL có thể được sử dụng để cấp phát và kiểm soát các thao tác củangười sử dụng trên dữ liệu, đảm bảo sự an toàn cho cơ sở dữ • Đảm bảo toàn vẹn dữ liệu : SQL định nghĩa các ràng buộc toàn vẹn trong cơ sở dữ liệu nhờ đó đảm bảo tính hợp lệ và chính xác của dữ liệu trước các thao tác cập nhật cũng như các lỗi của hệ thống. Như vậy, có thể nói rằng SQL là một ngôn ngữ hoàn thiện được sử dụng trong cáchệ thống cơ sở dữ liệu và là một thành phần không thể thiếu trong các hệ quản trị cơ sở dữ liệu. Mặc dù SQL không phải là một ngôn ngữ lập trình như C, C++, Java, song các câu lệnh mà SQL cung cấp có thể được nhúng vào trong các ngôn ngữ lập trình nhằm xây dựng các ứng dụng tương tác với cơ sở dữ liệu. 11/143
Khác với các ngôn ngữ lập trình quen thuộc như C, C++, Java, SQL là ngôn ngữ có tính khai báo. Với SQL, người dùng chỉ cần mô tả các yêu cầu cần phải thực hiện trên cơ sở dữ liệu mà không cần phải chỉ ra cách thức thực hiện các yêu cầu như thế nào. Chính vì vậy, SQL là ngôn ngữ dễ tiếp cận và dễ sử dụng. Cài đặt SQL Server Cài Ðặt SQL Server 2000 (Installation) Ta cần có Developer Edition và ít nhất là 64 MB RAM, 500 MB hard disk để có thể install SQL Server. Bạn có thể install trên Windows Server hay Windows XP Professional, Windows 2000 Professional hay NT Workstation nhưng không thể install trên Win 98 family. Vì một trong những đặc điểm của các sản phẩm Microsoft là dễ install nên chúng tôi không trình bày chi tiết về cách install hay các bước install mà chỉ trình bày các điểm cần lưu ý khi install mà thôi. Khi install cần lưu ý các điểm sau: Ở màn hình thứ hai bạn chọn Install Database Server. Sau khi install xong SQL Server bạn có thể install thêm Analysis Service nếu bạn thích. Ở màn hình Installation Definition bạn chọn Serverand ClientTools. Sau đó bạn nên chọn kiểu Custom và chọn tất cả các bộ phận của SQL Server. Ngoài ra nên chọn các giá trị mặc định (default) Ở màn hình Authentication Mode nhớ chọn Mixed Mode. Lưu ý vì SQL Server có thể dùng chung chế độ bảo mật (security) với Win NT và cũng có thể dùng chế độ bảo mật riêng của nó. Trong Production Server người ta thường dùng Windows Authetication vì độ an toàn cao hơn và dễ dàng cho người quản lý mạng và cả cho người sử dụng. Nghĩa là một khi bạn được chấp nhận (authenticated) kết nối vào domain thì bạn có quyền truy cập dữ liệu (access data) trong SQL Server. Tuy nhiên ta nên chọn Mixed Mode để dễ dàng cho việc học tập. Sau khi install bạn sẽ thấy một icon nằm ở góc phải bên dưới màn hình, đây chính là Service Manager. Bạn có thể Start, Stop các SQL Server services dễ dàng bằng cách double-click vào icon này. Một chút kiến thức về các Version của SQL Server SQL Server của Microsoft được thị trường chấp nhận rộng rãi kể từ version 6.5. Sau đó Microsoft đã cải tiến và hầu như viết lại một engine mới cho SQL Server 7.0. Cho nên có thể nói từ version 6.5 lên version 7.0 là một bước nhảy vọt. Có một số 12/143
đặc tính của SQL Server 7.0 không tương thích với version 6.5. Trong khi đó từ Version 7.0 lên version 8.0 (SQL Server 2000) thì những cải tiến chủ yếu là mở rộng các tính năng về web và làm cho SQL Server 2000 đáng tin cậy hơn. Một điểm đặc biệt đáng lưu ý ở version 2000 là Multiple-Instance. Nói cho dễ hiểu là bạn có thể install version 2000 chung với các version trước mà không cần phải uninstall chúng. Nghĩa là bạn có thể chạy song song version 6.5 hoặc 7.0 với version 2000 trên cùng một máy (điều này không thể xảy ra với các version trước đây). Khi đó version cũ trên máy bạn là DefaultInstance còn version 2000 mới vừa install sẽ là NamedInstance. Sơ lược về SQL Tổng quan về T- SQL Bản thân SQL không phải là một hệ quản trị cơ sở dữ liệu, nó không thể tồn tại độc lập. SQL thực sự là một phần của hệ quản trị cơ sở dữ liệu, nó xuất hiện trong các hệ quản trị cơ sở dữ liệu với vai trò ngôn ngữ và là công cụ giao tiếp giữa người sử dụng và hệ quản trị cơ sở dữ liệu. Trong hầu hết các hệ quản trị cơ sở dữ liệu quan hệ, SQL có những vai trò như sau: • SQL là ngôn ngữ hỏi có tính tương tác: Người sử dụng có thể dễ dàng thông qua các trình tiện ích để gởi các yêu cầu dưới dạng các câu lệnh SQL đến cơ sở dữ liệu và nhận kết quả trả về từ cơ sở dữ liệu • SQL là ngôn ngữ lập trình cơ sở dữ liệu: Các lập trình viên có thể nhúng các câu lệnh SQL vào trong các ngôn ngữ lập trình để xây dựng nên các chương trình ứng dụng giao tiếp với cơ sở dữ liệu • SQL là ngôn ngữ quản trị cơ sở dữ liệu : Thông qua SQL, người quản trị cơ sở dữ liệu có thể quản lý được cơ sở dữ liệu, định nghĩa các cấu trúc lưu trữ dữ liệu, điều khiển truy cập cơ sở dữ liệu, • SQL là ngôn ngữ cho các hệ thống khách/chủ (client/server): Trong các hệ thống cơ sở dữ liệu khách/chủ, SQL được sử dụng như là công cụ để giao tiếp giữa các trình ứng dụng phía máy khách với máy chủ cơ sở dữ liệu. • SQL là ngôn ngữ truy cập dữ liệu trên Internet : Cho đến nay, hầu hết các máy chủ Web cũng như các máy chủ trên Internet sử dụng SQL với vai trò là ngôn ngữ để tương tác với dữ liệu trong các cơ sở dữ liệu. 13/143
• SQL là ngôn ngữ cơ sở dữ liệu phân tán : Đối với các hệ quản trị cơ sở dữ liệu phân tán, mỗi một hệ thống sử dụng SQL để giao tiếp với các hệ thống khác trên mạng, gởi và nhận các yêu cầu truy xuất dữ liệu với nhau. • SQL là ngôn ngữ sử dụng cho các cổng giao tiếp cơ sở dữ liệu : Trong một hệ thống mạng máy tính với nhiều hệ quản trị cơ sở dữ liệu khác nhau, SQL thường được sử dụng như là một chuẩn ngôn ngữ để giao tiếp giữa các hệ quản trị cơ sở dữ liệu SQL chuẩn bao gồm lệnh thường được sử dụng nhấ t khoảng 40 câu lệnh. Các bảng phía dưới liệt kê danh sách các câu trong số các câu lệnh của SQL. Trong các hệ quản trịcơ sở dữ liệu khác nhau, mặc dù các câu lệnh đều có cùng dạng và cùng mục đích sử dụng song mỗi một hệ quản trị cơ sở dữ liệu có thể có một số thay đổi nào đó. Điều này đôi khi dẫn đến cú pháp chi tiết của các câu lệnh có thể sẽ khác nhau trong các hệ quản trị cơ cơ sở dữ liệu khác nhau. Câu l ệ nh t hao tác dữ li ệ u C h ứ c n ă n g SELECT Truy xuất dữ liệu INSERT Bổ sung dữ diệu UPDATE Cập nhật dữ liệu DELETE Xoá dữ liệu TRUNCATE Xoá toàn bộ dữ liệu trong bảng Câu l ệ nh định nghĩa dữ liệu C h ứ c n ă n g CREATE TABLE Tạo bảng DROP TABLE Xoá bảng ALTER TABLE Sửa đổi bảng CREATE VIEW Tạo khung nhìn ALTER VIEW Sửa đổi khung nhìn DROP VIEW Xoá khung nhìn CREATE INDEX Tạo chỉ mục DROP INDEX Xoá chỉ mục CREATE SCHEMA Tạo lược đồ cơ sở dữ liệu DROP SCHEMA Xoá lược đồ cơ sở dữ liệu 14/143
CREATE PROCEDURE Tạo thủ tục lưu trữ ALTER PROCEDURE Sửa đổi thủ tục lưu trữ DROP PROCEDURE Xoá thủ tục lưu trữ CREATE FUNCTION Tạo hàm (do người sử dụng định nghĩa) ALTER FUNCTION Sửa đổi hàm DROP FUNCTION Xoá hàm CREATE TRIGGER Tạo trigger ALTER TRIGGER Sửa đổi trigger DROP TRIGGER Xoá trigger Câu l ệ nh điều khiển truy cập C h ứ c n ă n g GRANT Cấp phát quyền cho người sử dụng REVOKE Thu hồi quyền từ người sử dụng Câu l ệ nh quản lý giao dịch C h ứ c n ă n g COMMIT Uỷ thác (kết thúc thành công) giao dịch ROLLBACK Quay lui giao dịch SAVE TRANSACTION Đánh dấu một điểm trong giao dịch Câu l ệ nh lập trình C h ứ c n ă n g DECLARE Khai báo biến hoặc định nghĩa con trỏ OPEN Mở một con trỏ để truy xuất kết quả truy vấn FETCH Đọc một dòng trong kết quả truy vấn (sử dụng con trỏ) CLOSE Đóng một con trỏ EXECUTE Thực thi một câu lệnh SQL Các câu lệnh của SQL đều được bắt đầu bởi các từ lệnh, là một từ khoá cho biết chức năng của câu lệnh (chẳng hạn SELECT, DELETE, COMMIT). Sau từ lệnh là các mệnh đề của câu lệnh. Mỗi một mệnh đề trong câu lệnh cũng được bắt đầu bởi một từ khoá (chẳng hạn FROM, WHERE, ). 15/143
Câu lệnh: SELECT masv,hodem,ten FROM sinhvien WHERE malop=’C24102’ dùng để truy xuất dữ liệu trong bảng SINHVIEN được bắt đầu bởi từ lệnh SELECT, trong câu lệnh bao gồm hai mệnh đề: mệnh đề FROM chỉ định tên của bảng cần truy xuất dữ liệu và mệnh đề WHERE chỉ định điều kiện truy vấn dữ liệu. Qui tắc sử dụng tên trong SQL Các đối tượng trong cơ sở dữ liệu dựa trên SQL được xác định thông qua tên của đối tượng. Tên của các đối tượng là duy nhất trong mỗi cơ sở dữ liệu. Tên được sử dụng nhiều nhất trong các truy vấn SQL và được xem là nền tảng trong cơ sở dữ liệu quan hệ là tên bảng và tên cột. Trong các cơ sở dữ liệu lớn với nhiều người sử dụng, khi ta chỉ định tên của một bảng nào đó trong câu lệnh SQL, hệ quản trị cơ sở dữ liệu hiểu đó là tên của bảng do ta sở hữu (tức là bảng do ta tạo ra). Thông thường, trong các hệ quản trị cơ sở dữ liệu này cho phép những người dùng khác nhau tạo ra những bảng trùng tên với nhau mà không gây ra xung đột về tên. Nếu trong một câu lệnh SQL ta cần chỉ đến một bảng do một người dùng khác sở hữu (hiển nhiên là phải được phép) thì tên của bảng phải được viết sau tên của người sở hữu và phân cách với tên người sở hữu bởi dấu chấm: tên_người_sở_hữu.tên_bảng Một số đối tượng cơ sở dữ liệu khác (như khung nhìn, thủ tục, hàm), việc sử dụng tên cũng tương tự như đối với bảng. Ta có thể sử dụng tên cột một cách bình thường trong các câu lệnh SQL bằng cảch chỉ cần chỉ định tên của cột trong bảng. Tuy nhiên, nếu trong câu lệnh có liên quan đến hai cột trở lên có cùng tên trong các bảng khác nhau thì bắt buộc phải chỉ định thêm tên bảng trước tên cột; tên bảng và tên cột được phân cách nhau bởi dấu chấm. Ví dụ dưới đây minh hoạ cho ta thấy việc sử dụng tên bảng và tên cột trong câu lệnh SQL SELECT masv,hodem,ten,sinhvien.malop,tenlop FROM dbo.sinhvien,dbo.lop WHERE sinhvien.malop = lop.malop Kiểu dữ liệu Chuẩn ANSI/ISO SQL cung cấp các kiểu dữ liệu khác nhau để sử dụng trong các cơ sở dữ liệu dựa trên SQL và trong ngôn ngữ SQL. Dựa trên cơ sở các kiểu dữ liệu do chuẩn ANSI/ISO SQL cung cấp, các hệ quản trị cơ sở dữ liệu thương mại hiện nay có thể sử 16/143
dụng các dạng dữ liệu khác nhau trong sản phẩm của mình. Bảng 1.2 dưới đây liệt kê một số kiểu dữ liệu thông dụng được sử dụng trong SQL. Một số kiểu dữ liệu thông dụng trong SQL Tên kiểu Mô tả CHAR (n) Kiểu chuỗi với độ dài cố định NCHAR (n) Kiếu chuỗi với độ dài cố định hỗ trợ UNICODE VARCHAR (n) Kiểu chuỗi với độ dài chính xác NVARCHAR (n) Kiểu chuỗi với độ dài chính xác hỗ trợ UNICODE INTEGER Số nguyên có giá trị từ -231 đến 231 - 1 INT Như kiểu Integer TINYTINT Số nguyên có giá trị từ 0 đến 255. SMALLINT Số nguyên có giá trị từ -215 đến 215 – 1 BIGINT Số nguyên có giá trị từ -263 đến 263-1 NUMERIC (p,s) Kiểu số với độ chính xác cố định. DECIMAL (p,s) Tương tự kiểu Numeric FLOAT Số thực có giá trị từ -1.79E+308 đến 1.79E+308 REAL Số thực có giá trị từ -3.40E + 38 đến 3.40E + 38 MONEY Kiểu tiền tệ BIT Kiểu bit (có giá trị 0 hoặc 1) DATETIME Kiểu ngày giờ (chính xác đến phần trăm của giây) SMALLDATETIME Kiểu ngày giờ (chính xác đến phút) TIMESTAMP BINARY Dữ liệu nhị phân với độ dài cố định (tối đa 8000 bytes) VARBINARY Dữ liệu nhị phân với độ dài chính xác (tối đa 8000 bytes) Dữ liệu nhị phân với độ dài chính xác (tối đa 2,147,483,647 IMAGE bytes) TEXT Dữ liệu kiếu chuỗi với độ dài lớn (tối đa 2,147,483,647 ký tự) Dữ liệu kiếu chuỗi với độ dài lớn và hỗ trợ UNICODE (tối đa NTEXT 1,073,741,823 ký tự) 17/143
Câu lệnh dưới đây định nghĩa bảng với kiểu dữ liệu được qui định cho các cột trong bảng CREATE TABLE NHANVIEN ( MANV NVARCHAR(10) NOT NULL, HOTEN NVARCHAR(30) NOT NULL, GIOITINH BIT, NGAYSINH SMALLDATETIME, NOISINH NCHAR(50), HSLUONG DECIMAL(4,2), MADV INT ) Giá trị NULL Một cơ sở dữ liệu là sự phản ánh của một hệ thống trong thế giới thực, do đó các giá trị dữ liệu tồn tại trong cơ sở dữ liệu có thể không xác định được. Một giá trị không xác định được xuất hiện trong cơ sở dữ liệu có thể do một số nguyên nhân sau: • Giá trị đó có tồn tại nhưng không biết. • Không xác định được giá trị đó có tồn tại hay không. • Tại một thời điểm nào đó giá trị chưa có nhưng rồi có thể sẽ có. • Giá trị bị lỗi do tính toán (tràn số, chia cho không, ) Những giá trị không xác định được biểu diễn trong cơ sở dữ liệu quan hệ bởi các giá trị NULL. Đây là giá trị đặc biệt và không nên nhầm lẫn với chuỗi rỗng (đối với dữ liệu kiểu chuỗi) hay giá trị không (đối với giá trị kiểu số). Giá trị NULL đóng một vai trò quan trọng trong các cơ sở dữ liệu và hầu hết các hệ quản trị cơ sở dữ liệu quan hệ hiện nay đều hỗ trợ việc sử dụng giá trị này. Các tập tin vật lý lưu trữ cơ sở dữ liệu Mặc dù phải quản lý nhiều đối tượng bên trong cơ sở dữ liệu nhưng Microsoft SQL Server chỉ tổ chức hai loại tập tin để lưu trữ. Một cơ sở dữ liệu trong Microsoft SQL Server tối thiểu sẽ dùng hai (2) tập tin vật lý để lưu trữ dữ liệu: Datafile: dùng lưu trữ dữ liệu. Transaction log file : dùng để lưu trữ các hành động thực hiện trên cơ sở dữ liệu trong quá trình sử dụng. Các hành động thực hiện trên CSDL gọi là các giao tác. 18/143
Các loại tập tin lưu trữ dữ liệu của SQL Sever 2000 Các loại tập tin lưu trữ dữ liệu của SQL Sever 2000 Các tập tin lưu trữ cơ sở dữ liệu bên trong Microsoft SQL Server được phân chia thành ba loại tập tin vật lý khác nhau: Tập tin dữ liệu chính (Primary Data File) : Đây là tập tin chính dùng để lưu trữ các thông tin hệ thống của cơ sở dữ liệu và phần còn lại dùng lưu trữ một phần dữ liệu. Phần mở rộng của tập tin này thông thường là *.MDF. Tập tin dữ liệu thứ yếu(Secondary Data Files) : Đây là tập tin dùng lưu trữ các đối tượng dữ liệu không nằm trong tập tin dữ liệu chính. Loại tập tin này không bắt buộc phải có khi tạo mới cơ sở dữ liệu. Phần mở rộng của tập tin này thông thường là *.NDF. Tập tin lưu vết (Log Files): Đây là tập tin dùng lưu vết các giao tác – là những hành động cập nhật dữ liệu (thêm, sửa, xóa) vào các bảng do người sử dụng tác động trên cơ sở dữ liệu. Tập tin sẽ này hỗ trợ cho phép các bạn có thể hủy bỏ (rollback) các thao tác cập nhật dữ liệu đã được thực hiện hay giúp SQL Server phục hồi dữ liệu trong các trường hợp gặp sự cố như mất điện, Phần mở rộng của tập tin này thông thường là *.LDF. Kết chương Như vậy, SQL (viết tắt của StructuredQueryLanguage) là hệ thống ngôn ngữ được sử dụng cho các hệ quản trị cơ sở dữ liệu quan hệ. Thông qua SQL có thể thực hiện được 19/143
các thao tác trên cơ sở dữ liệu như định nghĩa dữ liệu, thao tác dữ liệu, điều khiển truy cập, quản lý toàn vẹn dữ liệu SQL là một thành phần quan trọng và không thể thiếu trong hệ quản trị cơ sở dữ liệu quan hệ. SQL ra đời nhằm sử dụng cho các cơ sở dữ liệu theo mô hình quan hệ. Trong một cơ sở dữ liệu quan hệ, dữ liệu được tổ chức và lưu trữ trong các bảng. Mỗi một bảng là một tập hợp bao gồm các dòng và các cột; mỗi một dòng là một bản ghi và mỗi một cột tương ứng với một trường, tập các tên cột cùng với kiểu dữ liệu và các tính chất khác tạo nên cấu trúc của bảng, tập các dòng trong bảng chính là dữ liệu của bảng. Các bảng trong một cơ sở dữ liệu có mối quan hệ với nhau. Các mối quan hệ được biểu diễn thông qua khoá chính và khoá ngoài của các bảng. Khoá chính của bảng là tập một hoặc nhiều cột có giá trị duy nhất trong bảng và do đó giá trị của nó xác định duy nhất một dòng dữ liệu trong bảng. Một khoá ngoài là một tập một hoặc nhiều cột có giá trị được xác định từ khoá chính của các bảng khác. 20/143
Ngôn ngữ định nghĩa dữ liệu Ngôn ngữ định nghĩa dữ liệu Các câu lệnh SQL đã đề cập đến trong chương 2 được sử dụng nhằm thực hiện các thao tác bổ sung, cập nhật, loại bỏ và xem dữ liệu. Nhóm các câu lệnh này được gọi là ngôn ngữ thao tác dữ liệu (DML). Trong chuơng này, chúng ta sẽ tìm hiểu nhóm các câu lệnh được sử dụng để định nghĩa và quản lý các đối tượng CSDL như bảng, khung nhìn, chỉ mục, và được gọi là ngôn ngữ định nghĩa dữ liệu (DLL). Về cơ bản, ngôn ngữ định nghĩa dữ liệu bao gồm các lệnh: • CREATE: định nghĩa và tạo mới đối tượng CSDL. • ALTER: thay đổi định nghĩa của đối tượng CSDL. • DROP: Xoá đối tượng CSDL đã có. Tạo CSDL Sau khi có khái niệm về cách thức tổ chức các tập tin vật lý để lưu trữ dữ liệu trong Microsoft SQL Server, chúng ta sẽ tự tạo một cơ sở dữ liệu cho riêng mình nhằm lưu trữ các dữ liệu riêng biệt và đưa vào khai thác các dữ liệu đó. Cách dễ nhất để các bạn tạo ra một cơ sở dữ liệu là sử dụng tiện ích Enterprise Manager. Chỉ những người với vai trò là quản trị hệ thống (sysadmin) thì mới có thể tạo lập cơ sở dữ liệu. Do đó các bạn có thể đăng nhập vào với tên tài khoản người dùng là sa để thực hiện việc tạo cơ sở dữ liệu mới cho ứng dụng của mình. Trước khi giới thiệu từng bước tạo lập cơ sở dữ liệu, phần kế tiếp mà chúng tôi muốn trình bày là các thuộc tính của một cơ sở dữ liệu trong Microsoft SQL Server. Các thuộc tính nhằm giúp các bạn hiểu rõ thêm về bên trong cơ sở dữ liệu của Microsoft SQL Server, chúng gồm có: Tên cơ sở dữ liệu(database name) : là duy nhất trong một Microsoft SQL Server, độ dài tối đa là 123 ký tự. Theo chúng tôi các bạn nên đặt tên cơ sở dữ liệu gợi nhớ. Thí dụ: QLBanhang (Quản lý bán hàng), QLHocsinh (Quản lý học sinh) Vị trí tập tin (File location) : là tên và đường dẫn vật lý của các loại tập tin dữ liệu dùng để lưu trữ cơ sở dữ liệu của Microsoft SQL Server. Thông thường các tập tin này sẽ được lưu tại thư mục C:\MSSQL\DATA. Tên tập tin (File name) :là tên logic của mỗi loại tập tin dữ liệu tương ứng mà hệ thống Microsoft SQL Server dùng để quản lý bên trong. Tương ứng mỗi loại tập tin dữ liệu sẽ có một tên tập tin riêng biệt. 21/143
Kích thước ban đầu(Initial size) : là kích thước khởi tạo của tập tin dữ liệu khi cơ sở dữ liệu mới được tạo lập. Đơn vị tính là MegaByte (MB). Thông thường kích thước ban đầu của một cơ sở dữ liệu mới tối thiểu phải bằng với kích thước của cơ sở dữ liệu Model, bởi vì Microsoft SQL Server sẽ lấy cơ sở dữ liệu Model làm khuôn dạng mẫu khi hình thành một cơ sở dữ liệu mới. Việc tăng trưởng kích thước tập tin dữ liệu (File growth) : là các qui định cho việc tăng trưởng tự động kích thước tập tin dữ liệu, bởi vì các dữ liệu sẽ được lưu trữ ngày càng nhiều hơn so với kích thước ban đầu khi tạo lập. Việc tăng trưởng sẽ tự động làm tăng kích thước tập tin dữ liệu theo từng MB hoặc theo tỷ lệ phần trăm (by percent) của kích thước hiện hành khi các dữ liệu bên trong Microsoft SQL Server lưu trữ gần đầy so với kích thước tập tin vật lý hiện thời. Mặc định kích thước tập tin dữ liệu sẽ được tăng tự động 10% khi dữ liệu lưu trữ gần đầy. Kích thước tối đa tập tin dữ liệu (Maximum file size) : là việc qui định sự tăng trưởng tự động kích thước của các tập tin dữ liệu nhưng có giới hạn (restrict file growth) đến MB nào đó hoặc là không có giới hạn (un-restrict file growth). Trong trường hợp nếu các bạn chọn có giới hạn kích thước của tập tin dữ liệu thì chúng ta phải biết tự thêm vào các tập tin dữ liệu mới khi dữ liệu lưu trữ đã bằng với kích thước tối đa của tập tin dữ liệu. Các tập tin dữ liệu mới này chính là loại tập tin thứ yếu (Secondary data file) và chúng ta có thể lưu trữ các tập tin vật lý này tại các đĩa cứng khác có bên trong Microsoft SQL Server. Đây cũng là một trong nét đặc trưng của mô hình cơ sở dữ liệu phân tán (distributed database). Đối với các CSDL thực tế, việc xác định các tham số về kích thước ban đầu rất quan trọng vì nhiều lý do. Để đảm bảo có đủ không gian lưu trữ dữ liệu, bạn cần dành trước cho CSDL phòng khi những ứng hay CSDL khác sử dụng hết đĩa cứng. CSDL có kích thước nhỏ cũng sẽ ảnh hưởng tới tốc độ do SQL Server cần phải thực hiện nhiều lần thao tác mở rộng kích thước tập tin CSDL khi có dữ liệu thêm mới. Ngoài ra, đa số các dữ liệu trong CSDL thực tế theo thời gian không thể xoá bỏ mà cần phải lưu trữ (backup) lại trước. Việc lưu trữ và phục hồi (restore) dữ liệu cũng ảnh hưởng bởi kích thước các tập tin do chúng phải đủ nhỏ để lưu trên các đĩa CD- ROM hay băng từ. Các bước mà chúng tôi mô tả bên dưới sẽ giúp các bạn tạo ra một cơ sở dữ liệu mới bằng tiện ích Enterprise Manager. Bước1: Khởi động ứng dụng Enterprise Manager, chọn một (1) Microsoft SQL Server đã được đăng ký quản trị trước đó. Chọn chức năng New Database trong thực đơn tắt sau khi nhấn chuột phải trên đối tượng Database 22/143
Chọn chức năng New Database Bước 2: Trong màn hình các thuộc tính của cơ sở dữ liệu (Database Properties) tại trang General gõ vào tên cơ sở dữ liệu muốn tạo mới. 23/143
Trang Genneral với các thuộc tính của CSDL Bước 3: Trong màn hình các thuộc tính của cơ sở dữ liệu (Database Properties) tại trang Data Files, chỉ định kích thước ban đầu khi khởi tạo của tập tin dữ liệu chính, kế tiếp thay đổi các thuộc tính khác (nếu cần). Chuyển sang trang Transaction Log để thay đổi các thuộc tính của tập tin lưu vết theo cách tương tự. 24/143
Các thuộc tính trong trang Transaction Log Tùy thuộc vào kích thước của cơ sở dữ liệu mà thời gian thực hiện tạo cơ sở dữ liệu sẽ nhanh hoặc lâu. Ngoài ra chúng ta còn có thể tạo mới một cơ sở dữ liệu bằng câu lệnh CREATE DATABASE được thực hiện trong tiện ích Query Analyzer. Các thành phần trong câu lệnh này hoàn toàn giống với các thuộc tính của cơ sở dữ liệu mà chúng tôi đã giới thiệu trong phần trên. Để tạo ra một cơ sở dữ liệu có tên QLBanHang với kích thước ban đầu lúc khởi tạo của tập tin dữ liệu chính là 50MB, tự động tăng kích thước lên 10% khi dữ liệu bị đầy, kích thước tăng trưởng tập tin dữ liệu tối đa không quá 200MB. Và tập tin lưu vết với kích thước ban đầu lúc khởi tạo là 10MB, tự động tăng kích thước tập tin lên 5MB khi dữ liệu bị đầy, kích thước tăng trưởng tập tin không giới hạn. Các bạn sẽ thực hiện câu lệnh CREATE DATABASE như sau: 25/143
Xoá cơ sở dữ liệu đã có Một cơ sở dữ liệu sau khi tạo xong sau một thời gian dài mà các bạn không còn khai thác dữ liệu bên trong đó thì các bạn có thể hủy bỏ để làm cho dung lượng đĩa trống được tăng lên. Tuy nhiên phải chắc rằng các thông tin dữ liệu trong cơ sở dữ liệu mà các bạn dự định xóa sẽ không còn hữu ích về sau nữa. Bởi vì chúng ta không thể khôi phục khi đã xóa. Để hủy bỏ cơ sở dữ liệu trong Microsoft SQL Server chúng ta có nhiều cách thực hiện: sử dụng câu lệnh DROP DATABASE, nhấn phím Delete hoặc nhấn chuột trên biểu tượng Delete và xác định đồng ý hủy bỏ cơ sở dữ liệu đã chọn trong tiện ích Enterprise Manager. Để hủy bỏ cơ sở dữ liệu QLBanHang, thực hiện câu lệnh DROP DATABSE như sau: DROP DATABASE QLBanHang Hoặc nhấn phím Delete trên tên của cơ sở dữ liệu này trong tiện ích Enterprise Manager và xác nhận là đồng ý (chọn Yes) để hủy bỏ cơ sở dữ liệu QLBanHang. Hệ thống Microsoft SQL Server không cho người sử dụng có thể hủy bỏ các cơ sở dữ liệu hệ thống như là: Master, Model, Tempdb bởi vì các cơ sở dữ liệu luôn được hệ thống Microsoft SQL Server sử dụng. Ngoài ra để hủy bỏ một cơ sở dữ liệu thành công thì phải đảm bảo không còn người sử dụng nào đang truy cập vào cơ sở dữ liệu đó. Trong trường hợp khi thực hiện hủy bỏ cơ sở dữ liệu đang còn người sử dụng truy cập thì hệ thống sẽ hiển thị thông báo bên dưới. Chú ý 26/143
T uyệt đối không xóa cơ sở dữ liệu bằng c ách sử dụng W i n dows Explo r e r ho ặ c W i n do w s Commander đ ể h ủ y bỏ các loại tập tin dữ l i ệu t r ong thư m ụ c C:\MSSQL\ D A T A\ vì làm như thế sẽ ảnh hưởng t rực tiếp đ ến hệ thống cơ sở dữ liệu Mic r osoft S QL Serve r . Tạo bảng dữ liệu Như đã nói đến ở chương 1, bảng dữ liệu là cấu trúc có vai trò quan trọng nhất trong cơ sở dữ liệu quan hệ. Toàn bộ dữ liệu của cơ sở dữ liệu được tổ chức trong các bảng, những bảng này có thể là những bảng hệ thống được tạo ra khi tạo lập cơ sở dữ liệu, và cũng có thể là những bảng do người sử dụng định nghĩa. Hình 2.4: Bảng trong CSDL quan hệ Trong các bảng, dữ liệu được chức dưới dạng các dòng và cột. Mỗi một dòng là một bản ghi duy nhất trong bảng và mỗi một cột là một trường. Các bảng trong cơ sở dữ liệu được sử dụng để biểu diễn thông tin, lưu giữ dữ liệu về các đối tượng trong thế giới thực và/hoặc mối quan hệ giữa các đối tượng. Bảng trong hình 3.1 bao gồm 10 bản ghi và 4 trường là MAKHOA, TENKHOA, DIENTHOAI và TRUONGKHOA. Câu lệnh CREATE TABLE được sử dụng để định nghĩa một bảng dữ liệu mới trong cơ sở dữ liệu. Khi định nghĩa một bảng dữ liệu mới, ta cần phải xác định được các yêu cầu sau đây: • Bảng mới được tạo ra sử dụng với mục đích gì và có vai trò như thế nào trong cơ sở dữ liệu. • Cấu trúc của bảng bao gồm những trường (cột) nào, mỗi một trường có ý nghĩa như thế nào trong việc biểu diễn dữ liệu, kiểu dữ liệu của mỗi trường là gì và trường đó có cho phép nhận giá trị NULL hay không. 27/143
• Những trường nào sẽ tham gia vào khóa chính của bảng. Bảng có quan hệ với những bảng khác hay không và nếu có thì quan hệ như thế nào. • Trên các trường của bảng có tồn tại những ràng buộc về khuôn dạng, điều kiện hợp lệ của dữ liệu hay không; nếu có thì sử dụng ở đâu và như thế nào. Tạo cấu trúc bảng dữ liệu bằng EM Sau khi xem xét và hiểu được các thuộc tính liên quan đến cấu trúc của bảng, trong phần này chúng tôi sẽ hướng dẫn các bạn các cách để tạo cấu trúc bảng dữ liệu mới. Để tạo cấu trúc bảng chúng tôi hướng dẫn các bạn hai (2) cách thực hiện. Đầu tiên là tạo cấu trúc bảng bằng tiện ích Enterprise Manager. Kể từ bây giờ chúng tôi xem như các bạn đã đăng ký quản trị một Microsoft SQL Server và bên trong Microsoft SQL Server này, cơ sở dữ liệu quản lý bán hàng (QLBanHang) đã được tạo lập. Các bảng dữ liệu và những đối tượng khác ở các phần trình bày kế tiếp sẽ được tạo ra bên trong cơ sở dữ liệu QLBanHang này. Các bước thực hiện việc tạo bảng dữ liệu trong Enterprise Manager như sau: Bước 1:Trong ứng dụng Enterprise Manager, mở rộng cơ sở dữ liệu để thấy các đối tượng bên trong. Nhấn chuột phải trên đối tượng Tables, chọn chức năng New Table trong thực đơn tắt. Tạo bảng dữ liệu Bước 2: Trong màn hình thiết kế cấu trúc bảng (design table), lần lượt gõ vào tên các cột bên trong bảng, chọn lựa các kiểu dữ liệu tương ứng thích hợp và chỉ định các thuộc tính cần thiết cho các cột bên trong bảng. 28/143
Màn hình xây dựng cấu trúc bảng Bước 3: Định nghĩa khóa chính cho bảng và lưu lại cấu trúc bảng vừa định nghĩa. Đóng màn hình thiết kế cấu trúc bảng lại để kết thúc quá trình tạo cấu trúc bảng bằng tiện ích EM Màn hình chỉ định tên bảng mới Tạo cấu trúc bảng bằng T-SQL Câu lệnh CREATE TABLE có cú pháp như sau: 29/143
CREATE TABLE tên_bảng ( tên_cột thuộc_tính_cột các_ràng_buộc [, ,tên_cột_n thuộc_tính_cột_n các_ràng_buộc_cột_n] [,các_ràng_buộc_trên_bảng] ) Tên_bảng Tên của bảng cần tạo. Tên phải tuân theo qui tắc định danh và không được vượt quá 128 ký tự. tên_cột Là tên của cột (trường) cần định nghĩa, tên cột phải tuân theo qui tắc định danh và không được trùng nhau trong mỗi một bảng. Mỗi một bảng phải có ít nhất một cột. Nếu bảng có nhiều cột thì định nghĩa của các cột (tên cột, thuộc tính và các ràng buộc) phải phân cách nhau bởi dấu phẩy. Thuộc_tính_cột Mỗi một cột trong một bảng ngoài tên cột còn có các thuộc tính bao gồm: • Kiểu dữ liệu của cột. Đây là thuộc tính bắt buộc phải có đối với mỗi cột. • Giá trị mặc định của cột: là giá trị được tự động gán cho cột nếu như người sử d ụng không nhập dữ liệu cho cột một cách tường minh. Mỗi một cột chỉ có thể có nhiều nhất một giá trị mặc định. • Cột có tính chất IDENTITY hay không? tức là giá trị của cột có được tự động tăng mỗi khi có bản ghi mới được bổ sung hay không. Tính chất này chỉ có thể sử dụng đối vớicác trường kiểu số. • Cột có chấp nhận giá trị NULL hay không Đây là phần ví dụ , xác định khoảng của ví dụ đó rồi chọn style Khai báo dưới đây định nghĩa cột STT có kiểu dữ liệu là int và cột có tính chất IDENTITY: stt INT IDENTITY hay định nghĩa cột NGAY có kiểu datetime và không cho phép chấp nhận giá trị NULL: ngay DATETIME NOT NULL và định nghĩa cột SOLUONGkiểu intvà có giá trị mặc định là 0: soluong INT DEFAULT (0) Các_ràng_buộc: Các ràng buộc được sử dụng trên mỗi cột hoặc trên bảng nhằm các mục đích sau: 30/143
Quy định khuôn dạng hay giá trị dữ liệu được cho phép trên cột (chẳng hạn qui định tuổi của một học sinh phải lớn hơn 6 và nhỏ hơn 20, số điện thoại phải là một chuỗi bao gồm 6 chữ số, ). Những ràng buộc kiểu này được gọi là ràng buộc CHECK Đảm bảo tính toàn vẹn dữ liệu trong một bảng và toàn vẹn tham chiếu giữa các bảng trong cơ sở dữ liệu. Những loại ràng buộc này nhằm đảm bảo tính đùng của dữ liệu như: số chứng minh nhân dân của mỗi một người phải duy nhất, nếu sinh viên học một lớp nào đó thì lớp đó phải tồn tại, Liên quan đến những loại ràng buộc này bao gồm các ràng buộc PRIMARY KEY (khoá chính), UNIQUE (khóa dự tuyển) và FOREIGN KEY (khoá ngoài) Các loại ràng buộc này sẽ được trình bày chi tiết hơn ở phần sau. Câu lệnh dưới đây định nghĩa bảng NHANVIEN với các trường MANV (mã nhân viên), HOTEN (họ và tên), NGAYSINH (ngày sinh của nhân viên), DIENTHOAI (điện thoại) và HSLUONG (hệ số lương) CREATE TABLE nhanvien ( manv NVARCHAR(10) NOT NULL, hoten NVARCHAR(50) NOT NULL, ngaysinh DATETIME NULL, dienthoai NVARCHAR(10) NULL, hsluong DECIMAL(3,2) DEFAULT (1.92) ) Trong câu lệnh trên, trường MANV và HOTEN của bảng NHANVIEN không được NULL (tức là bắt buộc phải có dữ liệu), trường NGAYSINH và DIENTHOAI sẽ nhận giá trị NULL nếu ta không nhập dữ liệu cho chúng còn trường HSLUONG sẽ nhận giá trị mặc định là 1.92 nếu không được nhập dữ liệu. Nếu ta thực hiện các câu lệnh dưới đây sau khi thực hiện câu lệnh trên để bổ sung dữ liệu cho bảng NHANVIEN INSERT INTO nhanvien VALUES('NV01','Le Van A','2/4/ 75','886963',2.14) INSERT INTO nhanvien(manv,hoten)VALUES('NV02','Mai Thi B') INSERT INTO nhanvien(manv,hoten,dienthoai) VALUES('NV03','Tran Thi C','849290') Ta sẽ có được dữ liệu trong bảng NHANVIEN như sau: 31/143
Ràng buộc CHECK Ràng buộc CHECK được sử dụng nhằm chỉ định điều kiện hợp lệ đối với dữ liệu. Mỗi khi có sự thay đổi dữ liệu trên bảng (INSERT, UPDATE), những ràng buộc này sẽ được sử dụng nhằm kiểm tra xem dữ liệu mới có hợp lệ hay không. Ràng buộc CHECK được khai báo theo cú pháp như sau: [CONTRAINT tên_ràng_buộc] CHECK (điều kiện) Trong đó, điều_kiện là một biểu thức logic tác động lên cột nhằm qui định giá trị hoặc khuôn dạng dữ liệu được cho phép. Trên mỗi một bảng cũng như trên mỗi một cột có thể có nhiều ràng buộc CHECK. Câu lệnh dưới đây tạo bảng DIEMTOTNGHIEP trong đó qui định giá trị của cột DIEMVAN và DIEMTOAN phải lớn hơn hoặc bằng 0 và nhỏ hơn hoặc bằng 10 CREATE TABLE diemtotnghiep ( Hoten NVARCHAR(30) NOT NULL Ngaysinh DATETIME, Diemvan DECIMAL(4,2) CONSTRAINT chk_diemvan CHECK(diemvan>=0 AND diemvan =0 AND diemtoan<=10), ) Như vậy, với định nghĩa như trên của bảng DIEMTOTNGHIEP, các câu lệnh dưới đây là hợp lệ: CREATE TABLE diemtotnghiep ( INSERT INTO diemtotnghiep(hoten,diemvan,diemtoan) VALUES('Le Thanh Hoang',9.5,2.5) INSERT INTO diemtotnghiep(hoten,diemvan) VALUES('Hoang Thi Mai',2.5) ) còn câu lệnh dưới đây là không hợp lệ: INSERT INTO diemtotnghiep(hoten,diemvan,diemtoan) VALUES('Tran Van Hanh',6,10.5) do cột DIEMTOAN nhận giá trị 10.5 không thoả mãn điều kiện của ràng buộc Trong ví dụ trên, các ràng buôc được chỉ định ở phần khai báo của mỗi cột. Thay vì chỉ định ràng buộc trên mỗi cột, ta có thể chỉ định các ràng buộc ở mức bảng bằng cách khai báo các ràng buộc sau khi đã khai báo xong các cột trong bảng. Câu lệnh 32/143
CREATE TABLE lop ( malop NVARCHAR(10) NOT NULL , tenlop NVARCHAR(30) NOT NULL , khoa SMALLINT NULL , hedaotao NVARCHAR(25) NULL CONSTRAINT chk_lop_hedaotao CHECK (hedaotao IN ('chính quy','tại chức')), namnhaphoc INT NULL CONSTRAINT chk_lop_namnhaphoc CHECK (namnhaphoc<=YEAR(GETDATE())), makhoa NVARCHAR(5) có thể được viết lại như sau: CREATE TABLE lop ( malop NVARCHAR(10) NOT NULL , tenlop NVARCHAR(30) NOT NULL , khoa SMALLINT NULL , hedaotao NVARCHAR(25) NULL, namnhaphoc INT NULL , makhoa NVARCHAR(5), CONSTRAINT chk_lop CHECK (namnhaphoc<=YEAR(GETDATE()) AND hedaotao IN ('chính quy','tại chức')) ) Ràng buộc PRIMARY KEY Ràng buộc PRIMARY KEY được sử dụng để định nghĩa khoá chính của bảng. Khoá chính của một bảng là một hoặc một tập nhiều cột mà giá trị của chúng là duy nhất trong bảng. Hay nói cách khác, giá trị của khoá chính sẽ giúp cho ta xác định được duy nhất một dòng (bản ghi) trong bảng dữ liệu. Mỗi một bảng chỉ có thể có duy nhất một khoá chính và bản thân khoá chính không chấp nhận giá trị NULL. Ràng buộc PRIMARY KEY là cơ sở cho việc đảm bảo tính toàn vẹn thực thể cũng như toàn vẹn tham chiếu. Để khai báo một ràng buộc PRIMARY KEY, ta sử dụng cú pháp như sau: [CONSTRAINT tên_ràng_buộc] PRIMARY KEY [(danh_sách_cột)] Nếu khoá chính của bảng chỉ bao gồm đúng một cột và ràng buộc PRIMARY KEY được chỉ định ở mức cột, ta không cần thiết phải chỉ định danh sách cột sau từ khoá PRIMARY KEY. Tuy nhiên, nếu việc khai báo khoá chính được tiến hành ở mức bảng (sử dụng khi số lượng các cột tham gia vào khoá là từ hai trở lên) thì bắt buộc phải chỉ định danh sách cột ngay sau từ khóa PRIMARY KEY và tên các cột được phân cách nhau bởi dấu phẩy. Câu lệnh dưới đây định nghĩa bảng SINHVIEN với khoá chính là MASV CREATE TABLE sinhvien ( masv NVARCHAR(10) CONSTRAINT pk_sinhvien_masv PRIMARY KEY, hodem NVARCHAR(25) NOT NULL , ten NVARCHAR(10) NOT NULL , ngaysinh DATETIME, gioitinh BIT, noisinh NVARCHAR(255), malop NVARCHAR(10) ) 33/143
Với bảng vừa được tạo bởi câu lệnh ở trên, nếu ta thực hiện câu lệnh: INSERT INTO sinhvien(masv,hodem,ten,gioitinh,malop) VALUES('0261010001','Lê Hoàng Phương','Anh',0,'C26101') một bản ghi mới sẽ được bổ sung vào bảng này. Nhưng nếu ta thực hiện tiếp câu lệnh: INSERT INTO sinhvien(masv,hodem,ten,gioitinh,malop) VALUES('0261010001','Lê Huy','Đan',1,'C26101') thì câu lệnh này sẽ bị lỗi do trùng giá trị khoá với bản ghi đã có. Câu lệnh dưới đây tạo bảng DIEMTHI với khoá chính là tập bao gồm hai cột MAMONHOC và MASV CREATE TABLE diemthi ( ma NVARCHAR(10) NOTNULL Diemlan1NUMERIC(4, 2), Diemlan2NUMERIC(4, 2), CONSTRAINT pk_diemthi PRIMARY KEY(mamonhoc,masv) ) Lưu ý : • Mỗi một bảng chỉ có thể có nhiều nhất một ràng buộc PRIMARY KEY. • Một khoá chính có thể bao gồm nhiều cột nhưng không vượt quá 16 cột. Ràng buộc UNIQUE Trên một bảng chỉ có thể có nhiều nhất một khóa chính nhưng có thể có nhiều cột hoặc tập các cột có tính chất như khoá chính, tức là giá trị của chúng là duy nhất trong bảng. Tập một hoặc nhiều cột có giá trị duy nhất và không được chọn làm khoá chính được gọi là khoá phụ (khoá dự tuyển) của bảng. Như vậy, một bảng chỉ có nhiều nhất một khoá chính nhưng có thể có nhiều khoá phụ. Ràng buộc UNIQUE được sử dụng trong câu lệnh CREATE TABLE để định nghĩa khoá phụ cho bảng và được khai báo theo cú pháp sau đây: [CONSTRAINT tên_ràng_buộc] UNIQUE [(danh_sách_cột)] Giả sử ta cần định nghĩa bảng LOP với khoá chính là cột MALOP nhưng đồng thời lại không cho phép các lớp khác nhau được trùng tên lớp với nhau, ta sử dụng câu lệnh như sau: 34/143
CREATE TABLE lop ( ma NVARCHAR(10) ten NVARCHAR(10) khoa SMALLINT NULL hedaotao NVARCHAR(10) NULL namnhaphoc INT NULL makhoa NVARCHAR (10) CONSTRAINT pk_lop PRIMARY KEY (malop), CONSTRAINT unique_lop_tenlop UNIQUE(tenlop) ) Ràng buộc FOREIGN KEY Các bảng trong một cơ sở dữ liệu có mối quan hệ với nhau. Những mối quan hệ này biểu diễn cho sự quan hệ giữa các đối tượng trong thế giới thực. Về mặt dữ liệu, những mối quan hệ được đảm bảo thông qua việc đòi hỏi sự có mặt của một giá trị dữ liệu trong bảng này phải phụ thuộc vào sự tồn tại của giá trị dữ liệu đó ở trong một bảng khác. Ràng buộc FOREIGN KEY được sử dụng trong định nghĩa bảng dữ liệu nhằm tạo nên mối quan hệ giữa các bảng trong một cơ sở dữ liệu. Một hay một tập các cột trong một bảng được gọi là khoá ngoại, tức là có ràng buộc FOREIGN KEY, nếu giá trị của nó được xác định từ khoá chính (PRIMARY KEY) hoặc khoá phụ (UNIQUE) của một bảng dữ liệu khác. Hình dưới đây cho ta thấy được mối quan hệ giữa 3 bảng DIEMTHI, SINHVIEN và MONHOC. Trong bảng DIEMTHI, MASV là khoá ngoài tham chiếu đến cột MASV của bảng SINHVIEN và MAMONHOC là khoá ngoài tham chiếu đến cột MAMONHOC của bảng MONHOC. Mối quan hệ giữa các bảng 35/143
Với mối quan hệ được tạo ra như hình trên, hệ quản trị cơ sở dữ liệu sẽ kiểm tra tính hợp lệ của mỗi bản ghi trong bảng DIEMTHI mỗi khi được bổ sung hay cập nhật. Một bản ghi bất kỳ trong bảng DIEMTHI chỉ hợp lệ (đảm bảo ràng buộc FOREIGN KEY) nếu giá trị của cột MASV phải tồn tại trong một bản ghi nào đó của bảng SINHVIEN và giá trị của cột MAMONHOC phải tồn tại trong một bản ghi nào đó của bảng MONHOC. Ràng buộc FOREIGN KEY được định nghĩa theo cú pháp dưới đây: [CONSTRAINT tên_ràng_buộc] FOREIGN KEY [(danh_sách_cột)] REFERENCES tên_bảng_tham_chiếu(danh_sách_cột_tham_chiếu) [ON DELETE CASCADE | NO ACTION | SET NULL | SET DEFAULT] [ON UPDATE CASCADE | NO ACTION | SET NULL | SET DEFAULT] Việc định nghĩa một ràng buộc FOREIGN KEY bao gồm các yếu tố sau: • Tên cột hoặc danh sách cột của bảng được định nghĩa tham gia vào khoá ngoài. • Tên của bảng được tham chiếu bởi khoá ngoài và danh sách các cột được tham chiếu đến trong bảng tham chiếu. • Cách thức xử lý đối với các bản ghi trong bảng được định nghĩa trong trường hợp các bản ghi được tham chiếu trong bảng tham chiếu bị xoá (ON DELETE) hay cập nhật (ON UPDATE). SQL chuẩn đưa ra 4 cách xử lý: • CASCADE: Tự động xoá (cập nhật) nếu bản ghi được tham chiếu bị xoá (cập nhật). • NO ACTION: (Mặc định) Nếu bản ghi trong bảng tham chiếu đang được tham chiếu bởi một bản ghi bất kỳ trong bảng được định nghĩa thì bàn ghi đó không được phép xoá hoặc cập nhật (đối với cột được tham chiếu). • SET NULL: Cập nhật lại khoá ngoài của bản ghi thành giá trị NULL (nếu cột cho phép nhận giá trị NULL). • SET DEFAULT: Cập nhật lại khoá ngoài của bản ghi nhận giá trị mặc định (nếu cột có qui định giá trị mặc định). Câu lệnh dưới đây định nghĩa bảng DIEMTHI với hai khoá ngoài trên cột MASV và cột MAMONHOC (giả sử hai bảng SINHVIEN và MONHOC đã được định nghĩa) CREATE TABLE diemthi ( ma NVARCHAR (10) ma NVARCHAR(10) diemlan1 NUMERIC(4,2) diemlan2 NUMERIC(4,2) CONSTRAINT 36/143
pk_diemthi PRIMARY KEY(mamonhoc,masv), CONSTRAINT fk_diemthi_mamonhoc FOREIGN KEY(mamonhoc) REFERENCES monhoc(mamonhoc) ON DELETE CASCADE ON UPDATE CASCADE, CONSTRAINT fk_diemthi_masv FOREIGN KEY(masv) REFERENCES sinhvien(masv) ON DELETE CASCADE ON UPDATE CASCADE ) Lưu ý: • Cột được tham chiếu trong bảng tham chiếu phải là khoá chính (hoặc là khoá phụ). • Cột được tham chiếu phải có cùng kiểu dữ liệu và độ dài với cột tương ứng trong khóa ngoài. • Bảng tham chiếu phải được định nghĩa trước. Do đó, nếu các bảng có mối quan hệ vòng, ta có thể không thể định nghĩa ràng buộc FOREIGN KEY ngay trong câu lệnh CREATE TABLE mà phải định nghĩa thông qua lệnh ALTER TABLE. Sửa đổi định nghĩa bảng Một bảng sau khi đã được định nghĩa bằng câu lệnh CREATE TABLE có thể được sửa đổi thông qua câu lệnh ALTER TABLE. Câu lệnh này cho phép chúng ta thực hiện được các thao tác sau: • Bổ sung một cột vào bảng. • Xoá một cột khỏi bảng. • Thay đổi định nghĩa của một cột trong bảng. • Xoá bỏ hoặc bổ sung các ràng buộc cho bảng Cú pháp của câu lệnh ALTER TABLE như sau: ALTER TABLE tên_bảng ADD định_nghĩa_côt | ALTER COLUMN tên_cột kiểu_dữ_liêu [NULL | NOT NULL] | DROP COLUMN tên_cột | ADD CONSTRAINT tên_ràng_buộc định_nghĩa_ràng_buộc | DROP CONSTRAINT tên_ràng_buộc Các ví dụ dưới đây minh hoạ cho ta cách sử dụng câu lệnh ALTER TABLE trong các trường hợp. Giả sử ta có hai bảng DONVI và NHANVIEN với định nghĩa như sau: 37/143
CREATE TABLE donvi ( madvINTNOT NULLPRIMARY KEY, tendvNVARCHAR(30)NOT NULL ) CREATE TABLE nhanvien ( ma NVARCHAR(10) hoten NVARCHAR(30) ngaysinh DATETIME, diachiCHAR(30)NOT NULL ) Bổ sung vào bảng NHANVIEN cột DIENTHOAI với ràng buộc CHECK nhằm qui định điện thoại của nhân viên là một chuỗi 6 chữ số: ALTER TABLE nhanvien ADD dienthoai NVARCHAR(6) CONSTRAINT chk_nhanvien_dienthoai CHECK (dienthoai LIKE '[09][09][0- 9][09][09][09]') Bổ sung thêm cột MADV vào bảng NHANVIEN: ALTER TABLE nhanvien ADD madv INT NULL Định nghĩa lại kiểu dữ liệu của cột DIACHI trong bảng NHANVIEN và cho phép cột này chấp nhận giá trị NULL: ALTER TABLE nhanvien ALTER COLUMN diachi NVARCHAR(100) NULL Xoá cột ngày sinh khỏi bảng NHANVIEN : ALTER TABLE nhanvien DROP COLUMN ngaysinh Định nghĩa khoá chính (ràng buộc PRIMARY KEY) cho bảng NHANVIEN là cột MANV: ALTER TABLE nhanvien ADD CONSTRAINT pk_nhanvien PRIMARY KEY(manv) Định nghĩa khoá ngoài cho bảng NHANVIEN trên cột MADV tham chiếu đến cột MADV của bảng DONVI : ALTER TABLE nhanvien ADD CONSTRAINT_nhavien_madv FOREIGN KEY(madv) REFERENCES donvi(madv) ON DELETE CASCADE ON UPDATE CASCADE Xoá bỏ ràng buộc kiểm tra số điện thoại của nhân viên ALTER TABLE nhanvien DROP CONSTRAINT CHK_NHANVIEN_DIENTHOAI 38/143
L ưu ý: • Nếu bổ sung thêm một cột vào bảng và trong bảng đã có ít nhất một bản ghi thì cột mới cần bổ sung phải cho phép chấp nhận giá trị NULL hoặc phải có giá trị mặc định. • Muốn xoá một cột đang được ràng buộc bởi một ràng buộc hoặc đang được tham chiếu bởi một khoá ngoài, ta phải xoá ràng buộc hoặc khoá ngoài trước sao cho trên cột không còn bất kỳ một ràng buộc và không còn được tham chiếu bởi bất kỳ khoá ngoài nào. • Nếu bổ sung thêm ràng buộc cho một bảng đã có dữ liệu và ràng buộc cần bổ sung không được thoả mãn bởi các bản ghi đã có trong bảng thì câu lệnh ALTER TABLE không thực hiện được. Xoá bảng Khi một bảng không còn cần thiết , ta có thể xoá nó ra khỏi cơ sở dữ liệu bằng câu lệnh DROP TABLE. Câu lệnh này cũng đồng thời xoá tất cả những ràng buộc, chỉ mục, trigger liên quan đến bảng đó. Câu lệnh có cú pháp như sau: DROP TABLE tên_bảng Trong các hệ quản trị cơ sở dữ liệu, khi đã xoá một bảng bằng lệnh DROP TABLE, ta không thể khôi phục lại bảng cũng như dữ liệu của nó. Do đó, cần phải cẩn thận khi sử dụng câu lệnh này. Câu lệnh DROP TABLE không thể thực hiện được nếu bảng cần xoá đang được tham chiếu bởi một ràng buộc FOREIGN KEY. Trong trường hợp này, ràng buộc FOREIGN KEY đang tham chiếu hoặc bảng đang tham chiếu đến bảng cần xoá phải được xoá trước. Khi một bảng bị xoá, tất cả các ràng buộc, chỉ mục và trigger liên quan đến bảng cũng đồng thời bị xóa theo. Do đó, nếu ta tạo lại bảng thì cũng phải tạo lại các đối tượng này. Giả sử cột MADV trong bảng DONVI đang được tham chiếu bởi khoá ngoài fk_nhanvien_madvtrong bảng NHANVIEN. Để xoá bảng DONVI ra khỏi cơ sở dữ liệu, ta thực hiện hai câu lệnh sau: Xoá bỏ ràng buộc fk_nhanvien_madv khỏi bảng NHANVIEN: ALTER TABLE nhanvien DROP CONSTRAINT fk_nhanvien_madv 39/143
Xoá bảng DONVI: DROP TABLE donvi 40/143
Ngôn ngữ thao tác dữ liệu Ngôn ngữ thao tác dữ liệu Đối với đa số người sử dụng, SQL được xem như là công cụ hữu hiệu để thực hiện các yêu cầu truy vấn và thao tác trên dữ liệu. Trong chương này, ta sẽ bàn luận đến nhóm các câu lệnh trong SQL được sử dụng cho mục đích này. Nhóm các câu lệnh này được gọi chung là ngôn ngữ thao tác dữ liệu (DML: Data Manipulation Language) bao gồm các câu lệnh sau: • SELECT: Sử dụng để truy xuất dữ liệu từ môt hoặc nhiều bảng. • INSERT: Bổ sung dữ liệu. • UPDATE: Cập nhật dữ liệu • DELETE: Xoá dữ liệu Trong số các câu lệnh này, có thể nói SELECT là câu lệnh tương đối phức tạp và được sử dụng nhiều trong cơ sở dữ liệu. Với câu lệnh này, ta không chỉ thực hiện các yêu cầu truy xuất dữ liệu đơn thuần mà còn có thể thực hiện được các yêu cầu thống kê dữ liệu phức tạp. Cũng chính vì vậy, phần đầu của chương này sẽ tập trung tương đối nhiều đến câu lệnh SELECT. Các câu lệnh INSERT, UPDATE và DELETE được bàn luận đến ở cuối chương Truy xuất dữ liệu với câu lệnh SELECT Câu lệnh SELECT được sử dụng để truy xuất dữ liệu từ các dòng và các cột của một hay nhiều bảng, khung nhìn. Câu lệnh này có thể dùng để thực hiện phép chọn (tức là truy xuất một tập con các dòng trong một hay nhiều bảng), phép chiếu (tức là truy xuất một tập con các cột trong một hay nhiều bảng) và phép nối (tức là liên kết các dòng trong hai hay nhiều bảng để truy xuất dữ liệu). Ngoài ra, câu lệnh này còn cung cấp khả năng thực hiện các thao tác truy vấn và thống kê dữ liệu phức tạp khác. Cú pháp chung của câu lệnh SELECT có dạng: SELECT ALL | DISTINCT][TOP n] danh_sách_chọn [INTO tên_bảng_mới] FROMdanh_sách_bảng/khung_nhìn [WHEREđiều_kiện] [GROUP BYdanh_sách_cột] [HAVING điều_kiện] [ ORDER BYcột_sắp_xếp] [COMPUTEdanh_sách_hàm_gộp [BY danh_sách_cột]] 41/143
Điều cần lưu ý đầu tiên đối với câu lệnh này là các thành phần trong câu lệnh SELECT nếu được sử dụng phải tuân theo đúng thứ tự như trong cú pháp. Nếu không, câu lệnh sẽ được xem là không hợp lệ. Câu lệnh SELECT được sử dụng để tác động lên các bảng dữ liệu và kết quả của câu lệnh cũng được hiển thị dưới dạng bảng, tức là một tập hợp các dòng và các cột (ngoại trừ trường hợp sử dụng câu lệnh SELECT với mệnh đề COMPUTE). Kết quả của câu lệnh sau đây cho biết mã lớp, tên lớp và hệ đào tạo của các lớp hiện có SELECT malop,tenlop,hedaotao FROM lop Mệnh đề FROM Mệnh đề FROM trong câu lệnh SELECT được sử dung nhằm chỉ định các bảng và khung nhìn cần truy xuất dữ liệu. Sau FROM là danh sách tên của các bảng và khung nhìn tham gia vào truy vấn, tên của các bảng và khung nhìn được phân cách nhau bởi dấu phẩy. Câu lệnh dưới đây hiển thị danh sách các khoa trong trường SELECT * FROM khoa kết quả câu lệnh như sau: 42/143
Ta có thể sử dụng các bí danh cho các bảng hay khung nhìn trong câu lệnh SELECT. Bí danh được gán trong mệnh đề FROM bằng cách chỉ định bí danh ngay sau tên bảng. Câu lệnh sau gán bí danh là cho bảng khoa SELECT * FROM khoa a Danh sách chọn trong câu lệnh SELECT Danh sách chọn trong câu lệnh SELECT được sử dụng để chỉ định các trường,các biểu thức cần hiển thị trong các cột của kết quả truy vấn. Các trường, các biểu thức được chỉ định ngay sau từ khoá SELECT và phân cách nhau bởi dấu phẩy. Sử dụng danh sách chọn trong câu lệnh SELECT bao gồm các trường hợp sau: Chọn tất cả các cột trong bảng Khi cần hiển thị tất cả các trường trong các bảng, sử dụng ký tự * trong danh sách chọn thay vì phải liệt kê danh sách tất cả các cột. Trong trường hợp này, các cột được hiển thị trong kết quả truy vấn sẽ tuân theo thứ tự mà chúng đã được tạo ra khi bảng được định nghĩa. Câu lệnh SELECT * FROM lop cho kết quả bao như sau: 43/143
Tên cột trong danh sách chọn Trong trường hợp cần chỉ định cụ thể các cột cần hiển thị trong kết quả truy vấn, ta chỉ định danh sách các tên cột trong danh sách chọn. Thứ tự của các cột trong kết quả truy vấn tuân theo thứ tự của các trường trong danh sách chọn. Câu lệnh SELECT malop,tenlop,namnhaphoc,khoa FROM lop cho biết mã lớp, tên lớp, năm nhập học và khoá của các lớp và có kết quả như sau: Lưu ý: Nếu truy vấn được thực hiện trên nhiều bảng/khung nhìn và trong các bảng/ khung nhìn có các trường trùng tên thì tên của những trường này nếu xuất hiện trong danh sách chọn phải được viết dưới dạng: tên_bảng.tên_trường SELECT malop, tenlop, lop.makhoa, tenkhoa FROM lop, khoa WHERE lop.malop = khoa.makhoa 44/143
Thay đổi tiêu đề các cột Trong kết quả truy vấn, tiêu đề của các cột mặc định sẽ là tên của các trường tương ứng trong bảng. Tuy nhiên, để các tiêu đề trở nên thân thiện hơn, ta có thể đổi tên các tiêu đề của các cột. Để đặt tiêu đề cho một cột nào đó, ta sử dụng cách viết: tiêu_đề_cột = tên_trường hoặc tên_trường AS tiêu_đề_cột hoặc tên_trườngtiêu_đề_cột Câu lệnh dưới đây: SELECT 'Mã lớp'= malop,tenlop 'Tên lớp',khoa AS 'Khoá' FROM lop cho biết mã lớp, tên lớp và khoá học của các lớp trong trường. Kết quả của câu lệnh như sau: Sử dụng cấu trúc CASE trong danh sách chọn Cấu trúc CASE được sử dụng trong danh sách chọn nhằm thay đổi kết quả của truy vấn tuỳ thuộc vào các trường hợp khác nhau. Cấu trúc này có cú pháp như sau: CASE biểu_thức WHEN biểu_thức_kiểm_tra THEN kết_quả [ ] [ELSE kết_quả_của_else] END 45/143
hoặc CASE WHEN điều_kiện THEN kết_quả [ ] [ELSE kết_quả_của_else] END Để hiển thị mã, họ tên và giới tính (nam hoặc nữ) của các sinh viên, ta sử dụng câu lệnh SELECT masv,hodem,ten,CASE gioitinh WHEN 1 THEN ‘Nam’ ELSE ‘Nữ' END AS gioitinh FROM sinhvien hoặc SELECT masv,hodem,ten, CASE WHEN gioitinh=1 THEN 'Nam' ELSE 'Nữ' END AS gioitinh FROM sinhvien Kết quả của hai câu lệnh trên đều có dạng như sau Hằng và biểu thức trong danh sách chọn Ngoài danh sách trường, trong danh sách chọn của câu lệnh SELECT còn có thể sử dụng các biểu thức. Mỗi một biểu thức trong danh sách chọn trở thành một cột trong kết quả truy vấn. câu lệnh dưới đây cho biết tên và số tiết của các môn học SELECT tenmonhoc,sodvht*15 AS sotiet FROM monhoc 46/143
Nếu trong danh sách chọn có sự xuất hiện của giá trị hằng thì giá trị này sẽ xuât hiện trong một cột của kết quả truy vấn ở tất cả các dòng Câu lệnh SELECT tenmonhoc,Số tiết:',sodvht*15 AS sotiet FROM monhoc cho kết quả như sau: Loại bỏ các dòng dữ liệu trùng nhau trong kết quả truy vấn Trong kết quả của truy vấn có thể xuất hiện các dòng dữ liệu trùng nhau. Để loại bỏ bớt các dòng này, ta chỉ định thêm từ khóa DISTINCT ngay sau từ khoá SELECT. Hai câu lệnh dưới đây SELECT khoa FROM lop Và 47/143
SELECT DISTINCT khoa FROM lop có kết quả lần lượt như sau: Giới hạn số lượng dòng trong kết quả truy vấn Kết quả của truy vấn được hiển thị thường sẽ là tất cả các dòng dữ liệu truy vấn được. Trong trường hợp cần hạn chế số lượng các dòng xuất hiện trong kết quả truy vấn, ta chỉ định thêm mệnh đề TOP ngay trước danh sách chọn của câu lệnh SELECT. Câu lệnh dưới đây hiển thị họ tên và ngày sinh của 5 sinh viên đầu tiên trong danh sách SELECT TOP 5 hodem,ten,ngaysinh FROM sinhvien Ngoài cách chỉ định cụ số lượng dòng cần hiển thị trong kết quả truy vấn, ta có thể chỉ định số lượng các dòng cần hiển thị theo tỷ lệ phần trăm bằng cách sử dụng thêm từ khoá PERCENT như ở ví dụ dưới đây. Câu lệnh dưới đây hiển thị họ tên và ngày sinh của 10% số lượng sinh viên hiện có trong bảng SINHVIEN SELECT TOP 10 PERCENT hodem,ten,ngaysinh FROM sinhvien Chỉ định điều kiện truy vấn dữ liệu Mệnh đề WHERE trong câu lệnh SELECT được sử dụng nhằm xác định các điều kiện đối với việc truy xuất dữ liệu. Sau mệnh đề WHERE là một biểu thức logic và chỉ những dòng dữ liệu nào thoả mãn điều kiện được chỉ định mới được hiển thị trong kết quả truy vấn. Câu lệnh dưới đây hiển thị danh sách các môn học có số đơn vị học trình lớn hơn 3 48/143
SELECT * FROM monhoc WHERE sodvht>3 Kết quả của câu lệnh này như sau: Trong mệnh đề WHERE thường sử dụng: • Các toán tử kết hợp điều kiện (AND, OR) • Các toán tử so sánh • Kiểm tra giới hạn của dữ liệu (BETWEEN/ NOT BETWEEN) • Danh sách • Kiểm tra khuôn dạng dữ liệu. • Các giá trị NULL Các toán tử so sánh T oán tử Ý ng h ĩa = Bằng > Lớn hơn = Lớn hơn hoặc bằng khác !> Không lớn hơn !< Không nhỏ hơn Câu lệnh: 49/143
SELECT masv,hodem,ten,,ngaysinh FROM sinhvien WHERE (tenn=’Anh’) AND (YEAR(GETDATE())-YEAR(ngaysinh) b) Câu lệnh dưới đây cho biết họ tên và tuổi của các sinh viên có tên là Bình và có tuổi nằm trong khoảng từ 20 đến 22 SELECT hodem,ten,year(getdate())-year(ngaysinh) AS tuoi FROM sinhvien WHERE ten =’Bình’ AND YEAR(GETDATE())- YEAR(ngaysinh) BETWEEN 20 AND 22 Danh sách (IN và NOT IN) Từ khoá IN được sử dụng khi ta cần chỉ định điều kiện tìm kiếm dữ liệu cho câu lệnh SELECT là một danh sách các giá trị. Sau IN (hoặc NOT IN) có thể là một danh sách các giá trị hoặc là một câu lệnh SELECT khác. Để biết danh sách các môn học có số đơn vị học trình là 2, 4 hoặc 5, thay vì sử dụng câu lệnh 50/143
SELECT * FROM monhoc WHERE sodvht=2 OR sodvht=4 OR sodvht=5 ta có thể sử dụng câu lệnh SELECT * FROM monhoc WHERE sodvht IN (2,4,5) Toán tử LIKE và các ký tự đại diện Từ khoá LIKE (NOT LIKE) sử dụng trong câu lệnh SELECT nhằm mô tả khuôn dạng của dữ liệu cần tìm kiếm. Chúng thường được kết hợp với các ký tự đại diện sau đây Ký tự đ ại Ý n g h ĩa d i ệ n % Chuỗi ký tự bất kỳ gồm không hoặc nhiều ký tự - Ký tự đơn bất kỳ Ký tự đơn bất kỳ trong giới hạn được chỉ định (ví dụ[a-f]) hay một tập [] (ví dụ [abcdef]) Ký tự đơn bất kỳ không nằm trong giới hạn được chỉđịnh ( ví dụ [^a-f] [^] hay một tập (ví dụ [^abcdef]). Câu lệnh dưới đây SELECT hodem,ten FROM sinhvien WHERE hodem LIKE 'Lê%' cho biết họ tên của các sinh viên có họ là Lê và có kết quả như sau Câu lệnh: SELECT hodem,ten FROM sinhvien WHERE hodem LIKE 'Lê%' AND ten LIKE '[AB]%' 51/143
Có kết quả là: Giá trị NULL Dữ liệu trong một cột cho phép NULL sẽ nhận giá trị NULL trong các trường hợp sau: • Nếu không có dữ liệu được nhập cho cột và không có mặc định cho cột hay kiểu dữ liệu trên cột đó. • Người sử dụng trực tiếp đưa giá trị NULL vào cho cột đó. • Một cột có kiểu dữ liệu là kiểu số sẽ chứa giá trị NULL nếu giá trị được chỉ định gây tràn số. Trong mệnh đề WHERE, để kiểm tra giá trị của một cột có giá trị NULL hay không, ta sử dụng cách viết: WHEREtên_cộtIS NULL Hoặc : WHERE tên_cột IS NOT NULL Tạo mới bảng dữ liệu từ kết quả của câu lệnh SELECT Câu lệnh SELECT INTO có tác dụng tạo một bảng mới có cấu trúc và dữ liệu được xác định từ kết quả của truy vấn. Bảng mới được tạo ra sẽ có số cột bằng số cột được chỉ định trong danh sách chọn và số dòng sẽ là số dòng kết quả của truy vấn Câu lệnh dưới đây truy vấn dữ liệu từ bảng SINHVIEN và tạo một bảng TUOISV bao gồm các trường HODEM, TEN và TUOI SELECT hodem,ten,YEAR(GETDATE())YEAR(ngaysinh) AS tuoi INTO tuoisv FROM sinhvien 52/143
Lưu ý :Nếu trong danh sách chọn có các biểu thức thì những biểu thức này phải được đặt tiêu đề. Sắp xếp kết quả truy vấn Mặc định, các dòng dữ liệu trong kết quả của câu truy vấn tuân theo thứ tự của chúng trong bảng dữ liệu hoặc được sắp xếp theo chỉ mục (nếu trên bảng có chỉ mục). Trong trường hợp muốn dữ liệu được sắp xếp theo chiều tăng hoặc giảm của giá trị của một hoặc nhiều trường, ta sử dụng thêm mệnh đề ORDER BY trong câu lệnh SELECT; Sau ORDER BY là danh sách các cột cần sắp xếp (tối đa là 16 cột). Dữ liệu được sắp xếp có thể theo chiều tăng (ASC) hoặc giảm (DESC), mặc định là sắp xếp theo chiều tăng. Câu lệnh dưới đây hiển thị danh sách các môn học và sắp xếp theo chiều giảm dần của số đơn vị học trình SELECT * FROM monhoc ORDER BY sodvht DESC Nếu sau ORDER BY có nhiều cột thì việc sắp xếp dữ liệu sẽ được ưu tiên theo thứ tự từ trái qua phải. Câu lệnh SELECT hodem,ten,gioitinh YEAR(GETDATE())-YEAR(ngaysinh) AS tuoi FROM sinhvien WHERE ten=’Bình’ ORDER BY gioitinh,tuoi có kết quả là: 53/143
Thay vì chỉ định tên cột sau ORDER BY, ta có thể chỉ định số thứ tự của cột cấn được sắp xếp. Câu lệnh ở ví dụ trên có thể được viết lại như sau: SELECT hodem,ten,gioitinh YEAR(GETDATE())-YEAR(ngaysinh) AS tuoi FROM sinhvien WHERE ten = ‘Bình’ ORDER BY 3, 4 Phép hợp Phép hợp được sử dụng trong trường hợp ta cần gộp kết quả của hai hay nhiều truy vấn thành một tập kết quả duy nhất. SQL cung cấp toán tử UNION để thực hiện phép hợp. Cú pháp như sau Câu_lệnh_1 UNION [ALL] Câu_lệnh_2 [UNION [ALL] Câu_lệnh_3] [UNION [ALL] Câu_lệnh_n] [ORDER BY cột_sắp_xếp] [COMPUTE danh_sách_hàm_gộp [BY danh_sách_cột]] Trong đó Câu_lệnh_1 có dạng SELECTdanh_sách_cột [INTO tên_bảng_mới] [FROM danh_sách_bảng|khung_nhìn] [WHERE điều_kiện] [GROUP BY danh_sách_cột] [HAVING điều_kiện] và Câu_lệnh_i (i = 2, ,n) có dạng SELECT danh_sách_cột [FROM danh_sách_bảng|khung_nhìn] [WHERE điều_kiện] [GROUP BY danh_sách_cột] [HAVING điều_kiện] 54/143
Giả sử ta có hai bảng Table1 và Table2 lần lượt như sau: câu lệnh SELECT A,B FROM Table1 UNION SELECT D,E FROM table2 Cho kết quả như sau: Mặc định, nếu trong các truy vấn thành phần của phép hợp xuất hiện những dòng dữ liệu giống nhau thì trong kết quả truy vấn chỉ giữ lại một dòng. Nếu muốn giữ lại các dòng này, ta phải sử dụng thêm từ khoá ALL trong truy vấn thành phần. Câu lệnh SELECT A,B FROM Talbe1 UNION ALL SELECT D,E FROM table2 Cho kết quả như sau 55/143
Khi sử dụng toán tử UNION để thực hiện phép hợp, ta cần chú ý các nguyên tắc sau: • Danh sách cột trong các truy vấn thành phần phải có cùng số lượng. • Các cột tương ứng trong tất cả các bảng, hoặc tập con bất kỳ các cột được sử dụng trong bản thân mỗi truy vấn thành phần phải cùng kiểu dữ liệu. • Các cột tương ứng trong bản thân từng truy vấn thành phần của một câu lệnh UNION phải xuất hiện theo thứ tự như nhau. Nguyên nhân là do phép hợp so sánh các cột từng cột một theo thứ tự được cho trong mỗi truy vấn. • Khi các kiểu dữ liệu khác nhau được kết hợp với nhau trong câu lệnh UNION, chúng sẽ được chuyển sang kiểu dữ liệu cao hơn (nếu có thể được). • Tiêu đề cột trong kết quả của phép hợp sẽ là tiêu đề cột được chỉ định trong truy vấn đầu tiên. • Truy vấn thành phần đầu tiên có thể có INTO để tạo mới một bảng từ kết quả của chính phép hợp. • Mệnh đề ORDER BY và COMPUTE dùng để sắp xếp kết quả truy vấn hoặc tính toán các giá trị thống kê chỉ được sử dụng ở cuối câu lệnh UNION. Chúng không được sử dụng ở trong bất kỳ truy vấn thành phần nào. • Mệnh đề GROUP BY và HAVING chỉ có thể được sử dụng trong bản thân từng truy vấn thành phần. Chúng không được phép sử dụng để tác động lên kết quả chung của phép hợp. • Phép toán UNION có thể được sử dụng bên trong câu lệnh INSERT. • Phép toán UNION không được sử dụng trong câu lệnh CREATE VIEW. 56/143
Phép nối Khi cần thực hiện một yêu cầu truy vấn dữ liệu từ hai hay nhiều bảng, ta phải sử dụng đến phép nối. Một câu lệnh nối kết hợp các dòng dữ liệu trong các bảng khác nhau lại theo một hoặc nhiều điều kiện nào đó và hiển thị chúng trong kết quả truy vấn. Xét hai bảng sau đây: Bảng KHOA Bảng LOP Giả sử ta cần biết mã lớp và tên lớp của các lớp thuộc Khoa Công nghệ Thông tin, ta phải làm như sau: • Chọn ra dòng trong bảng KHOA có tên khoa là Khoa Công nghệ Thông tin, từ đó xác định được mã khoa (MAKHOA) là DHT02 . • Tìm kiếm trong bảng LOP những dòng có giá trị trường MAKHOA là DHT02 (tức là bằng MAKHOA tương ứng trong bảng KHOA) và đưa những dòng này vào kết quả truy vấn 57/143
Như vậy, để thực hiện được yêu cầu truy vấn dữ liệu trên, ta phải thực hiện phép nối giữa hai bảng KHOA và LOP với điều kiện nối là MAKHOA của KHOA bằng với MAKHOA của LOP. Câu lệnh sẽ được viết như sau: SELECT malop,tenlop FROM khoa,lop WHERE khoa.makhoa = lop.makhoa AND tenkhoa='Khoa Công nghệ Thông tin' Sử dụng phép nối Phép nối là cơ sở để thực hiện các yêu cầu truy vấn dữ liệu liên quan đến nhiều bảng. Một câu lệnh nối thực hiện lấy các dòng dữ liệu trong các bảng tham gia truy vấn, so sánh giá trị của các dòng này trên một hoặc nhiều cột được chỉ định trong điều kiện nối và kết hợp các dòng thoả mãn điều kiện thành những dòng trong kết quả truy vấn. Để thực hiện được một phép nối, cần phải xác định được những yếu tố sau: • Những cột nào cần hiển thị trong kết quả truy vấn • Những bảng nào có tham gia vào truy vấn. • Điều kiện để thực hiện phép nối giữa các bảng dữ liệu là gì Trong các yếu tố kể trên, việc xác định chính xác điều kiện để thực hiện phép nối giữa các bảng đóng vai trò quan trọng nhất. Trong đa số các trường hợp, điều kiện của phép nối được xác định nhờ vào mối quan hệ giữa các bảng cần phải truy xuất dữ liệu. Thông thường, đó là điều kiện bằng nhau giữa khoá chính và khoá ngoài của hai bảng có mối 58/143
quan hệ với nhau. Như vậy, để có thể đưa ra một câu lệnh nối thực hiện chính xác yêu cầu truy vấn dữ liệu đòi hỏi phải hiểu được mối quan hệ cũng như ý nghĩa của chúng giữa các bảng dữ liệu. Danh sách chọn trong phép nối Một câu lệnh nối cũng được bắt đầu với từ khóa SELECT. Các cột được chỉ định tên sau từ khoá SELECT là các cột được hiển thị trong kết quả truy vấn. Việc sử dụng tên các cột trong danh sách chọn có thể là: • Tên của một số cột nào đó trong các bảng có tham gia vào truy vấn. Nếu tên cột trong các bảng trùng tên nhau thì tên cột phải được viết dưới dạng tên_bảng.tên_cột • Dấu sao (*) được sử dụng trong danh sách chọn khi cần hiển thị tất cả các cột của các bảng tham gia truy vấn. • Trong trường hợp cần hiển thị tất cả các cột của một bảng nào đó, ta sử dụng cách viết: tên_bảng.* Mệnh đề FROM trong phép nối Sau mệnh đề FROM của câu lệnh nối là danh sách tên các bảng (hay khung nhìn) tham gia vào truy vấn. Nếu ta sử dụng dấu * trong danh sách chọn thì thứ tự của các bảng liệt kê sau FROM sẽ ảnh hưởng đến thứ tự các cột được hiển thị trong kết quả truy vấn. Mệnh đề WHERE trong phép nối Khi hai hay nhiều bảng được nối với nhau, ta phải chỉ định điều kiện để thực hiện phép nối ngay sau mệnh đề WHERE. Điều kiện nối được biểu diễn dưới dạng biểu thức logic so sánh giá trị dữ liệu giữa các cột của các bảng tham gia truy vấn. Các toán tử so sánh dưới đây được sử dụng để xác định điều kiện nối T oán tử Ý ng h ĩa = Bằng > Lớn hơn 59/143
= Lớn hơn hoặc bằng khác !> Không lớn hơn !< Không nhỏ hơn Câu lệnh dưới đây hiển thị danh sách các sinh viên với các thông tin: mã sinh viên, họ và tên, mã lớp, tên lớp và tên khoa SELECT masv,hodem,ten,sinhvien.malop,tenlop,tenkhoa FROM sinhvien,lop,khoa WHERE sinhvien.malop = lop.malop AND lop.makhoa=khoa.makhoa rong câu lệnh trên, các bảng tham gia vào truy vấn bao gồm SINHVIEN, LOP và KHOA. Điều kiện để thực hiện phép nối giữa các bảng bao gồm hai điều kiện: sinhvien.malop = lop.malop vàlop.malop = khoa.malop Điều kiện nối giữa các bảng trong câu lệnh trên là điều kiện bằng giữa khoá ngoài và khoá chính của các bảng có mối quan hệ với nhau. Hay nói cách khác, điều kiện của phép nối được xác định dựa vào mối quan hệ giữa các bảng trong cơ sở dữ liệu. 60/143
Phép nối Các loại phép nối Phép nối bằng và phép nối tự nhiên Một phép nối bằng(equi-join) là một phép nối trong đó giá trị của các cột được sử dụng để nối được so sánh với nhau dựa trên tiêu chuẩn bằng và tất cả các cột trong các bảng tham gia nối đều được đưa ra trong kết quả. Câu lệnh dưới đây thực hiện phép nối bằng giữa hai bảng LOP và KHOA SELECT * FROM lop,khoa WHERE lop.makhoa=khoa.makhoa Trong kết quả của câu lệnh trên, cột makhoa (mã khoa) xuất hiện hai lần trong kết quả phép nối (cột makhoa của bảng khoa và cột makhoa của bảng lop) và như vậy là không cần thiết. Ta có thể loại bỏ bớt đi những cột trùng tên trong kết quả truy vấn bằng cách chỉ định danh sách cột cần được hiển thị trong danh sách chọn của câu lệnh. Một dạng đặc biệt của phép nối bằng được sử dụng nhiều là phép nối tự nhiên (natural- join). Trong phép nối tự nhiên, điều kiện nối giữa hai bảng chính là điều kiện bằng giữa khoá ngoài và khoá chính của hai bảng. Và trong danh sách chọn của câu lệnh chỉ giữ lại một cột trong hai cột tham gia vào điều kiện của phép nối Để thực hiện phép nối tự nhiên, câu lệnh trong ví dụ 2.25 được viết lại như sau SELECT malop,tenlop,khoa,hedaotao,namnhaphoc, siso,lop.makhoa,tenkhoa,dienthoai FROM lop,khoa WHERE lop.makhoa=khoa.makhoa hoặc viết dưới dạng ngắn gọn hơn: SELECT lop.*,tenkhoa,dienthoai FROM lop,khoa WHERE lop.makhoa=khoa.makhoa Phép nối với các điều kiện bổ sung Trong các câu lệnh nối, ngoài điều kiện của phép nối được chỉ định trong mệnh đề WHERE còn có thể chỉ định các điều kiện tìm kiếm dữ liệu khác (điều kiện chọn) . Thông thường, các điều kiện này được kết hợp với điều kiện nối thông qua toán tử AND. 61/143
Câu lệnh dưới đây hiển thị họ tên và ngày sinh của các sinh viên Khoa Công nghệ Thông tin SELECT hodem,ten,ngaysinh FROM sinhvien,lop,khoa WHERE tenkhoa='Khoa Công nghệ Thông tin' AND sinhvien.malop = lop.malop AND lop.makhoa = khoa.makhoa Phép tự nối và các bí danh Phép tự nối là phép nối mà trong đó điều kiện nối được chỉ định liên quan đến các cột của cùng một bảng. Trong trường hợp này, sẽ có sự xuất hiện tên của cùng một bảng hiều lần trong mệnh đề FROM và do đó các bảng cần phải được đặt bí danh. Để biết được họ tên và ngày sinh của các sinh viên có cùng ngày sinh với sinh viên Trần Thị Kim Anh, ta phải thực hiện phép tự nối ngay trên chính bảng sinhvien. Trong câu lệnh nối, bảng sinhvien xuất hiện trong mệnh đề FROM với bí danh là a và b . Bảng sinhvien với bí danh là a sử dụng để chọn ra sinh viên có họ tên là Trần Thị Kim Anh và bảng sinhvien với bí danh là b sử dụng để xác định các sinh viên trùng ngày sinh với sinh viên Trần Thị Kim Anh. Câu lệnh được viết như sau: SELECT b.hodem,b.ten,b.ngaysinh FROM sinhvien a, sinhvien b WHERE a.hodem='Trần Thị Kim' AND a.ten='Anh' AND a.ngaysinh=b.ngaysinh AND a.masv<>b.masv Phép nối không dựa trên tiêu chuẩn bằng Trong phép nối này, điều kiện để thực hiện phép nối giữa các bảng dữ liệu không phải là điều kiện so sành bằng giữa các cột. Loại phép nối này trong thực tế thường ít được sử dụng. Phép nối ngoài (outer-join) Trong các phép nối đã đề cập ở trên, chỉ những dòng có giá trị trong các cột được chỉ định thoả mãn điều kiện kết nối mới được hiển thị trong kết quả truy vấn, và được gọi là phép nối trong (inner join) Theo một nghĩa nào đó, những phép nối này loại bỏ thông tin chứa trong những dòng không thoả mãn điều kiện nối. Tuy nhiên, đôi khi ta cũng cần giữ lại những thông tin này bằng cách cho phép những dòng không thoả mãn điều kiện nối có mặt trong kết quả của phép nối. Để làm điều này, ta có thể sử dụng phép nối ngoài . 62/143
SQL cung cấp các loại phép nối ngoài sau đây: • Phép nối ngoài trái(ký hiệu: *=): Phép nối này hiển thị trong kết quả truy vấn tất cả các dòng dữ liệu của bảng nằm bên trái trong điều kiện nối cho dù những dòng này không thoả mãn điều kiện của phép nối • Phép nối ngoài phải>(ký hiệu: =*): Phép nối này hiển thị trong kết quả truy vấn tất cả các dòng dữ liệu của bảng nằm bên phải trong điều kiện nối cho dù những dòng này không thoả điều kiện của phép nối. Giả sử ta có hai bảng DONVI và NHANVIEN như sau: Câu lệnh: SELECT * FROM nhanvien,donvi WHERE nhanvien.madv=donvi.madv có kết quả là: Nếu thực hiện phép nối ngoài trái giữa bảng NHANVIEN và bảng DONVI: SELECT * FROM nhanvien,donvi WHERE nhanvien.madv*=donvi.madv 63/143
kết quả của câu lệnh sẽ là: Và kết quả của phép nối ngoài phải: select * from nhanvien,donvi where nhanvien.madv=*donvi.madv như sau: Phép nối và các giá trị NULL Nếu trong các cột của các bảng tham gia vào điều kiện của phép nối có các giá trị NULL thì các giá trị NULL được xem như là không bằng nhau. Giả sử ta có hai bảng TABLE1 và TABLE2 như sau: A B 1 b1 NULL b2 4 b3 C D NULL d1 64/143
4 d2 Câu lệnh: SELECT * FROM table1, table2 WHERE A *= C Có kết quả là: A B C D 1 b1 NULL NULL NULL b2 NULL NULL 4 b3 4 d2 Sử dụng phép nối trong SQL2 Ở phần trước đã đề cập đến phương pháp sử dụng phép nối trong và phép nối ngoài trong truy vấn SQL. Như đã trình bày, điều kiện của phép nối trong câu lệnh được chỉ định trong mệnh đề WHERE thông qua các biểu thức so sánh giữa các bảng tham gia truy vấn. Chuẩn SQL2 (SQL-92) đưa ra một cách khác để biểu diễn cho phép nối, trong cách biểu diễn này, điều kiện của phép nối không được chỉ định trong mệnh đề WHERE mà được chỉ định ngay trong mệnh đề FROM của câu lệnh. Cách sử dụng phép nối này cho phép ta biểu diễn phép nối cũng như điều kiện nối được rõ ràng, đặc biệt là trong trường hợp phép nối được thực hiện trên ba bảng trở lên. Phép nối trong Điều kiện để thực hiện phép nối trong được chỉ định trong mệnh đề FROM theo cú pháp như sau: tên_bảng_1 [INNER] JOIN tên_bảng_2 ON điều_kiện_nối Để hiển thị họ tên và ngày sinh của các sinh viên lớp TinK24, thay vì sử dụng câu lệnh: SELECT hodem,ten,ngaysinh FROM sinhvien,lop WHERE tenlop='Tin K24' AND sinhvien.malop=lop.malop ta có thể sử dụng câu lệnh như sau: 65/143
SELECT hodem,ten,ngaysinh FROM sinhvien INNER JOIN lop ON sinhvien.malop=lop.malop WHERE tenlop='Tin K24' Phép nối ngoài SQL2 cung cấp các phép nối ngoài sau đây: • Phép nối ngoài trái (LEFT OUTER JOIN) • Phép nối ngoài phải (RIGHT OUTER JOIN) • Phép nối ngoài đầy đủ (FULL OUTER JOIN) Cũng tương tự như phép nối trong, điều kiện của phép nối ngoài cũng được chỉ định ngay trong mệnh đề FROM theo cú pháp: tên_bảng_1 LEFT|RIGHT|FULL [OUTER] JOIN tên_bảng_2 ON điều_kiện_nối Giả sử ta có hai bảng dữ liệu như sau: Bảng DONVI Bảng NHANVIEN Phép nối ngoài trái giữa hai bảng NHANVIEN và DONVI được biểu diễn bởi câu lệnh: SELECT * FROM nhanvien LEFT OUTER JOIN donvi ON nhanvien.madv=donvi.madv có kết quả là: 66/143
Câu lệnh: SELECT * FROM nhanvien RIGHT OUTER JOIN donvi ON nhanvien.madv=donvi.madv thực hiện phép nối ngoài phải giữa hai bảng NHANVIEN và DONVI, và có kết quả là: Nếu phép nối ngoài trái (tương ứng phải) hiển thị trong kết quả truy vấn cả những dòng dữ liệu không thoả điều kiện nối của bảng bên trái (tương ứng phải) trong phép nối thì phép nối ngoài đầy đủ hiển thị trong kết quả truy vấn cả những dòng dữ liệu không thoả điều kiện nối của cả hai bảng tham gia vào phép nối. Với hai bảng NHANVIEN và DONVI như ở trên, câu lệnh SELECT * FROM nhanvien FULL OUTER JOIN donvi ON nhanvien.madv=donvi.madv cho kết quả là: 67/143
Thực hiện phép nối trên nhiều bảng Một đặc điểm nổi bật của SQL2 là cho phép biểu diễn phép nối trên nhiều bảng dữ liệu một cách rõ ràng. Thứ tự thực hiện phép nối giữa các bảng được xác định theo nghĩa kết quả của phép nối này được sử dụng trong một phép nối khác. Câu lệnh dưới đây hiển thị họ tên và ngày sinh của các sinh viên thuộc Khoa Công nghệ Thông Tin SELECT hodem,ten,ngaysinh FROM (sinhvien INNER JOIN lop ON sinhvien.malop=lop.malop) INNER JOIN khoa ON lop.makhoa=khoa.makhoa WHERE tenkhoa=N'Khoa công nghệ thông tin' Trong câu lệnh trên, thứ tự thực hiện phép nối giữa các bảng được chỉ định rõ ràng: phép nối giữa hai bảng sinhvien và lop được thực hiện trước và kết quả của phép nối này lại tiếp tục được nối với bảng khoa. Thống kê dữ liệu với GROUP BY Ngoài khả năng thực hiện các yêu cầu truy vấn dữ liệu thông thường (chiếu, chọn, nối, ) như đã đề cập như ở các phần trước, câu lệnh SELECT còn cho phép thực hiện các thao tác truy vấn và tính toán thống kê trên dữ liệu như: cho biết tổng số tiết dạy của mỗi giáo viên,điểm trung bình các môn học của mỗi sinh viên, Mệnh đề GROUP BY sử dụng trong câu lệnh SELECT nhằm phân hoạch các dòng dữ liệu trong bảng thành các nhóm dữ liệu, và trên mỗi nhóm dữ liệu thực hiện tính toán các giá trị thống kê như tính tổng, tính giá trị trung bình, Các hàm gộp được sử dụng để tính giá trị thống kê cho toàn bảng hoặc trên mỗi nhóm dữ liệu. Chúng có thể được sử dụng như là các cột trong danh sách chọn của câu lệnh 68/143
SELECT hoặc xuất hiện trong mệnh đề HAVING, nhưng không được phép xuất hiện trong mệnh đề WHERE SQL cung cấp các hàm gộp dưới đây: Hàm gộp C h ứ c n ă n g SUM([ALL | DISTINCT] biểu_thức) Tính tổng các giá trị. AVG([ALL | DISTINCT] biểu_thức) Tính trung bình của các giá trị COUNT([ALL | DISTINCT] biểu_thức) Đếm số các giá trị trong biểu thức. COUNT(*) Đếm số các dòng được chọn MAX(biểu_thức) Tính giá trị lớn nhất MIN(biểu_thức) Tính giá trị nhỏ nhất Trong đó: • Hàm SUM và AVG chỉ làm việc với các biểu thức số. • Hàm SUM, AVG, COUNT, MIN và MAX bỏ qua các giá trị NULL khi tính toán. • Hàm COUNT(*) không bỏ qua các giá trị NULL. Mặc định, các hàm gộp thực hiện tính toán thống kê trên toàn bộ dữ liệu. Trong trường hợp cần loại bỏ bớt các giá trị trùng nhau (chỉ giữ lại một giá trị), ta chỉ định thêm từ khoá DISTINCT ở trước biểu thức là đối số của hàm. Thống kê trên toàn bộ dữ liệu Khi cần tính toán giá trị thống kê trên toàn bộ dữ liệu, ta sử dụng các hàm gộp trong danh sách chọn của câu lệnh SELECT. Trong trường hợp này, trong danh sách chọn không được sử dụng bất kỳ một tên cột hay biểu thức nào ngoài các hàm gộp. Để thống kê trung bình điểm lần 1 của tất cả các môn học, ta sử dụng câu lệnh như sau: SELECT AVG(diemlan1) FROM diemthi còn câu lệnh dưới đây cho biết tuổi lớn nhất, tuổi nhỏ nhất và độ tuổi trung bình của tất cả các sinh viên sinh tại Huế: 69/143
SELECT MAX(YEAR(GETDATE())-YEAR(ngaysinh)), MIN(YEAR(GETDATE())-YEAR(ngaysinh)), AVG(YEAR(GETDATE())- YEAR(ngaysinh)) FROM sinhvien WHERE noisinh=’Huế’ Thống kê dữ liệu trên các nhóm Trong trường hợp cần thực hiện tính toán các giá trị thống kê trên các nhóm dữ liệu, ta sử dụng mệnh đề GROUP BY để phân hoạch dữ liệu vào trong các nhóm. Các hàm gộp được sử dụng sẽ thực hiện thao tác tính toán trên mỗi nhóm và cho biết giá trị thống kê theo các nhóm dữ liệu. Câu lệnh dưới đây cho biết sĩ số (số lượng sinh viên) của mỗi lớp SELECT lop.malop,tenlop,COUNT(masv) AS siso FROM lop,sinhvien WHERE lop.malop=sinhvien.malop GROUP BY lop.malop,tenlop và có kết quả là còn câu lệnh: SELECT sinhvien.masv,hodem,ten, sum(diemlan1*sodvht)/sum(sodvht) FROM sinhvien,diemthi,monhoc WHERE sinhvien.masv=diemthi.masv AND diemthi.mamonhoc=monhoc.mamonhoc GROUP BY sinhvien.masv,hodem,ten cho biết trung bình điểm thi lần 1 các môn học của các sinh viên 70/143
Lưu ý : Trong trường hợp danh sách chọn của câu lệnh SELECT có cả các hàm gộp và những biểu thức không phải là hàm gộp thì những biểu thức này phải có mặt đầy đủ trong mệnh đề GROUP BY, nếu không câu lệnh sẽ không hợp lệ. Dưới đây là một câu lệnh sai SELECT lop.malop,tenlop,COUNT(masv) FROM lop,sinhvien WHERE lop.malop=sinhvien.malop GROUP BY lop.malop do thiếu trường TENLOP sau mệnh đề GROUP BY. Chỉ định điều kiện đối với hàm gộp Mệnh đề HAVING được sử dụng nhằm chỉ định điều kiện đối với các giá trị thống kê được sản sinh từ các hàm gộp tương tự như cách thức mệnh đề WHERE thiết lập các điều kiện cho câu lệnh SELECT. Mệnh đề HAVING thường không thực sự có nghĩa nếu như không sử dụng kết hợp với mệnh đề GROUP BY. Một điểm khác biệt giữa HAVING và WHERE là trong điều kiện của WHERE không được có các hàm gộp trong khi HAVING lại cho phép sử dụng các hàm gộp trong điều kiện của mình. Để biết trung bình điểm thi lần 1 của các sinh viên có điểm trung bình lớn hơn hoặc bằng 5, ta sử dụng câu lệnh như sau: SELECT sinhvien.masv,hodem,ten, SUM(diemlan1*sodvht)/sum(sodvht) FROM sinhvien,diemthi,monhoc WHERE sinhvien.masv=diemthi.masv AND diemthi.mamonhoc=monhoc.mamonhoc GROUP BY sinhvien.masv,hodem,ten HAVING sum(diemlan1*sodvht)/sum(sodvht)>=5 Thống kê dữ liệu với COMPUTE Khi thực hiện thao tác thống kê với GROUP BY, kết quả thống kê (được sản sinh bởi hàm gộp) xuất hiện dưới một cột trong kết quả truy vấn. Thông qua dạng truy vấn này, ta biết được giá trị thống kê trên mỗi nhóm dữ liệu nhưng không biết được chi tiết dữ liệu trên mỗi nhóm Câu lệnh: SELECT khoa.makhoa,tenkhoa,COUNT(malop) AS solop FROM khoa,lop WHERE khoa.makhoa=lop.makhoa GROUP BY khoa.makhoa,tenkhoa 71/143
cho ta biết được số lượng lớp của mỗi khoa với kết quả như sau: nhưng cụ thể mỗi khoa bao gồm những lớp nào thì chúng ta không thể biết được trong kết quả truy vấn trên. Mệnh đề COMPUTE sử dụng kết hợp với các hàm gộp (dòng) và ORDER BY trong câu lệnh SELECT cũng cho chúng ta các kết quả thống kê (của hàm gộp) trên các nhóm dữ liệu. Điểm khác biệt giữa COMPUTE và GROUP BY là kết quả thống kê xuất hiện dưới dạng một dòng trong kết quả truy vấn và còn cho chúng ta cả chi tiết về dữ liệu trong mỗi nhóm. Như vậy, câu lệnh SELECT với COMPUTE cho chúng ta cả chi tiết dữ liệu và giá trị thống kê trên mỗi nhóm. Mệnh đề COMPUTE BY có cú pháp như sau: COMPUTE hàm_gộp(tên_cột) [, , hàm_gộp (tên_cột)] BY danh_sách_cột Trong đó: • Các hàm gộp có thể sử dụng bao gồm SUM, AVG, MIN, MAX và COUNT. • danh_sách_cột: là danh sách cột sử dụng để phân nhóm dữ liệu Câu lệnh dưới đây cho biết danh sách các lớp của mỗi khoa và tổng số các lớp của mỗi khoa: SELECT khoa.makhoa,tenkhoa,malop,tenlop FROM khoa,lop WHERE khoa.makhoa=lop.makhoa ORDER BY khoa.makhoa COMPUTE COUNT(malop) BY khoa.makhoa kết quả của câu lệnh như sau: MAKHOA TENKHOA MALOP TENLOP DHT01 Khoa Toán cơ – Tin học C24101 Toán K24 DHT01 Khoa Toán cơ – Tin học C25101 Toán K25 72/143
DHT01 Khoa Toán cơ – Tin học C26101 Toán K26 CNT : 3 MAKHOA TENKHOA MALOP TENLOP DHT02 Khoa Công nghệ thông tin C26102 Tin K26 DHT02 Khoa Công nghệ thông tin C25102 Tin K25 DHT02 Khoa Công nghệ thông tin C24102 Tin K24 CNT : 3 MAKHOA TENKHOA MALOP TENLOP DHT03 Khoa Vật lý C24103 Lý K24 DHT03 Khoa Vật lý C25103 Lý K25 CNT : 2 MAKHOA TENKHOA MALOP TENLOP DHT05 Khoa Sinh học C25301 Sinh K25 DHT05 Khoa Sinh học C24103 Sinh K24 CNT : 2 Khi sử dụng mệnh đề COMPUTE BY cần tuân theo các qui tắc dưới đây: • Từ khóa DISTINCT không cho phép sử dụng với các hàm gộp dòng • Hàm COUNT(*) không được sử dụng trong COMPUTE. 73/143
• Sau COMPUTE có thể sử dụng nhiều hàm gộp, khi đó các hàm phải phân cách nhau bởi dấu phẩy. • Các cột sử dụng trong các hàm gộp xuất hiện trong mệnh đề COMPUTE phải có mặt trong danh sách chọn. • Không sử dụng SELECT INTO trong một câu lệnh SELECT có sử dụng COMPUTE. • Nếu sử dụng mệnh đề COMPUTE BY thì cũng phải sử dụng mệnh đề ORDER BY. Các cột liệt kê trong COMPUTE BY phải giống hệt hay là một tập con của những gì được liệt kê sau ORDER BY. Chúng phải có cùng thứ tự từ trái qua phải, bắt đầu với cùng một biểu thức và không bỏ qua bất kỳ một biểu thức nào. Chẳng hạn nếu mệnh đề ORDER BY có dạng: ORDER BY a, b, c Thì mệnh đề COMPUTE BY với hàm gộp F trên cột X theo một trong các cách dưới đây là hợp lệ: Và các cách sử dụng dưới đây là sai: COMPUTE F(X) BY b, c COMPUTE F(X) BY a, c COMPUTE F(X) BY c • Phải sử dụng một tên cột hoặc một biểu thức trong mệnh đề ORDER BY, việc sắp xếp không được thực hiện dựa trên tiêu đề cột. Trong trường hợp sử dụng COMPUTE mà không có BY thì có thể không cần sử dụng ORDER BY, khi đó phạm vi tính toán của hàm gộp là trên toàn bộ dữ liệu. Câu lệnh dưới đây hiển thị danh sách các lớp và tổng số lớp hiện có: SELECT malop,tenlop,hedaotao FROM lop ORDER BY makhoa COMPUTE COUNT(malop) kết quả của câu lệnh như sau: MALOP TENLOP HEDAOTAO C24101 Toán K24 Chính quy C25101 Toán K25 Chính quy 74/143
C26101 Toán K26 Chính quy C26102 Tin K26 Chính quy C25102 Tin K25 Chính quy C24102 Tin K24 Chính quy C24103 Lý K24 Chính quy C25103 Lý K25 Chính quy C25301 Sinh K25 Chính quy C24301 Sinh K24 Chính quy CNT10 Có thể thực hiện việc tính toán hàm gộp dòng trên các nhóm lồng nhau bằng cách sử dụng nhiều mệnh đề COMPUTE BY trong cùng một câu lệnh SELECT Câu lệnh: SELECT khoa.makhoa,tenkhoa,malop,tenlop FROM khoa,lop WHERE khoa.makhoa=lop.makhoa ORDER BY khoa.makhoa COMPUTE COUNT(malop) BY khoa.makhoa COMPUTE COUNT(malop) Cho biết danh sách các lớp của mỗi khoa, tổng số lớp theo mỗi khoa và tổng số lớp hiện có với kết quả như sau: MAKHOA TENKHOA MALOP TENLOP DHT01 Khoa Toán cơ – Tin học C24101 Toán K24 DHT01 Khoa Toán cơ – Tin học C25101 Toán K25 DHT01 Khoa Toán cơ – Tin học C26101 Toán K26 CNT3 MAKHOA TENKHOA MALOP TENLOP DHT02 Khoa Công nghệ thông tin C26102 Tin K26 DHT02 Khoa Công nghệ thông tin C25102 Tin K25 75/143
DHT02 Khoa Công nghệ thông tin C24102 Tin K24 CNT3 MAKHOA TENKHOA MALOP TENLOP DHT03 Khoa Vật lý C24103 Lý K24 DHT03 Khoa Vật lý C25103 Lý K25 CNT2 MAKHOA TENKHOA MALOP TENLOP DHT05 Khoa Sinh học C25301 Sinh K25 DHT05 Khoa Sinh học C24103 Sinh K24 CNT2 Truy vấn con (Subquery) Truy vấn con là một câu lệnh SELECT được lồng vào bên trong một câu lệnh SELECT, INSERT, UPDATE, DELETE hoặc bên trong một truy vấn con khác. Loại truy vấn này được sử dụng để biểu diễn cho những truy vấn trong đó điều kiện truy vấn dữ liệu cần phải sử dụng đến kết quả của một truy vấn khác. Cú pháp của truy vấn con như sau: (SELECT [ALL | DISTINCT] danh_sách_chọn FROMdanh_sách_bảng [WHEREđiều_kiện] [GROUP BYdanh_sách_cột] [HAVING điều_kiện]) Khi sử dụng truy vấn con cần lưu ý một số quy tắc sau: • Một truy vấn con phải được viết trong cặp dấu ngoặc. Trong hầu hết các trường hợp, một truy vấn con thường phải có kết quả là một cột (tức là chỉ có duy nhất một cột trong danh sách chọn). • Mệnh đề COMPUTE và ORDER BY không được phép sử dụng trong truy vấn con. • Các tên cột xuất hiện trong truy vấn con có thể là các cột của các bảng trong truy vấn ngoài. 76/143