Tin học - Chương 3: Biểu diễn dữ liệu

pdf 108 trang vanle 2520
Bạn đang xem 20 trang mẫu của tài liệu "Tin học - Chương 3: Biểu diễn dữ liệu", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdftin_hoc_chuong_3_bieu_dien_du_lieu.pdf

Nội dung text: Tin học - Chương 3: Biểu diễn dữ liệu

  1. NHNHPMƠNTINHPMƠNTINHCC Chương 3 BIUDIND LIU
  2. Ni dungchương 3 I. Khái nim v biu din d liu II. Biu din s nguyên III.Biu din s thc IV. Biu din ký t V. D liu âm thanh,hình nh 2
  3. I.Khái nim v biu din d liu 1. D liu trên máy tính 2. H đm theo v trí 3. Các h đm thơng dng 4. Chuyn đi gia các h đm 3
  4. 1.D liu trên máy tính  Máy tính là thit b đa phương tin (multimediadevice)  Máy tính lưu tr,x lý,hin th các dng d liu: • Giá tr s (numbers) • Văn bn (text) • Hình nh (images,graphics) • Âm thanh (audio) • Hình nh đng (video) 4
  5. Nén d liu (DataCompression)  Mc tiêu:gim kích thưc lưu tr d liu • T s nén (Compressionratio)  Cĩ hai k thut chính: • Nén khơng mt d liu (lossless):d liu cĩ th đưc phc hi nguyên vn t d liu nén • Nén cĩ mt d liu (lossly):cĩ mt phn d liu b mt khi nén 5
  6. D liu dng nh phân  Máy tính đưc thit k đ s dng d liu dng nh phân: • Giá thành thp • ð tincy cao  BIT(BinarydigiT):ch s nh phân 6
  7. 2.H đm theo v trí Xétví d 642tronghđmtheov trícơs 10: 6x102 =6x100 =600 +4x101 =4x10 =40 +2x10º =2x1 =2 =64210 (642tronghđm10) Hđm S mũ th hin cơs 10 v trí cach s 7
  8. Biu thc tng quát h đm theo v trí = Rlàcơs X dn1dn2 d1d0 cahđm n1 n2 1 dn1 *R +dn2 *R + +d1 *R +d0 nlà s ch s di là ch s tronggiá tr X tiv trí th i tronggiá tr X 642= 6 *102 + 4 *10+ 2 8
  9. Ví d:642trong h đm 12(64212) 2 64212= 6*12 + 4*12 + 2 =864 +48 +2 =91410 9
  10. 3.Các h đm thơng dng  H thp phân (decimal)dùng 10ch s: • 0,1,2,3,4,5,6,7,8,9  H nh phân (binary)dùng 2ch s: • 0,1  H bát phân (octal)dùng 8ch s: • 0,1,2,3,4,5,6,7  H thp lc phân (hexadecimal)dùng 16 ch s: • 0,1,2,3,4,5,6,7,8,9,A,B,C,D,E,F 10
  11. Mt s giá tr cn nh Dec Bin Oct Hex Dec Bin Oct Hex 0 0 0 0 8 1000 10 8 1 1 1 1 9 1001 11 9 2 10 2 2 10 1010 12 A 3 11 3 3 11 1011 13 B 4 100 4 4 12 1100 14 C 5 101 5 5 13 1101 15 D 6 110 6 6 14 1110 16 E 7 111 7 7 15 1111 17 F 11
  12. Mt s giá tr cn nh (tt) Dec Dec 22 0.25 26 64 21 0.5 27 128 20 1 28 256 21 2 29 512 22 4 210 1024 23 8 211 2048 24 16 212 4096 25 32 220 1048576 12
  13. 4.Chuyn đi gia các h đm  Chuyn t h 2,h 8,h 16sangh 10  Chuyn đi gia h 2và h 8  Chuyn đi gia h 2và h 16  Chuyn t h 10sangh 2  Chuyn t h 10sangh đm cơ s K 13
  14. Chuyn t h 2,h 8,h 16sangh 10  Dùng đnh nghĩa h đm theo v trí  Ví d 4 2 • 101012 =2 +2 +1 =2110 2 • 3458 =3*8 +4*8+5 =22910 2 • AB116 =10*16 +11*16+1=273710 14
  15. Chuyn đi gia h 2và h 8  Ba bit(nh phân)tương đương 1ch s h 8  Ví d: • 101001110 =101 001 110 =5168 • 10101 =10 101 =258 • 1758 =001 111 101 =11111012 15
  16. Chuyn đi gia h 2và h 16  Bn bit(nh phân)tương đương 1ch s h 16  Ví d: • 10100111=1010 0111 =A716 • 110110=11 0110 =3616 • 17516 =0001 0111 0101 =1011101012 16
  17. Chuyn t h 10sangh 2 Hai phương pháp thơng dng:  Phân tích thành tng các lũy tha ca 2  Thc hin các phép chia cho 2 17
  18. Phân tích thành tng các lũy tha ca 2  Ví d: 4510  ?2  45 =32+8+4+1 =25 +23 +22 +20 =1011012 18
  19. Thc hin các phép chia cho 2  Ví d: 4510  ?2 45 22 1 11 0 5 1 2 1 1 0 0 1 101101 19
  20. Chuyn t h 10sangh đm cơ s K Giá tr thp phân X  Thc hin các phép chia Xvà các thương s cĩ đưc cho K,cho đn khi thương s là 0  Kt qu là các dư s đưc ly theo chiu ngưc li (t đáy lên đnh.) 20
  21. Ví d:4510  ?3 45 15 0 5 0 1 2 0 1 12003 21
  22. Bài tp 1  ði các s thp phân sau đây sangh 2, h 8,h 16: • 50,129,200,257,300  ði các s thp phân sau sangh 3,h 7: • 50,150 22
  23. II.Biu din s nguyên 1. Các khái nim 2. S nguyên khơng du 3. S nguyên cĩ du 23
  24. 1.Các khái nim  Giá tr Xđưc biu din trên nbit • X:giá tr cn biu din • n:kích thưc biu din • Vi n bit ch biu din đưc các giá tr X trong mt khong biu din  S nguyên khơng du (unsignedinteger)  S nguyên cĩ du (signedinteger) 24
  25. 2.S nguyên khơng du  Dùng biu din nh phân ca giá tr X  Ví d: • X=1010,n=4  X=10102 • X=1010,n=8  X=000010102 • X=10010,n=8  X=011001002  Khong biu din:0 2n1 • n=8: 0 255 • n=16: 0 65535 25
  26. Bài tp 2  Tìm biu din nh phân, bát phân, thp lc phân ca các s thp phân khơng du sau đây: • 81,102,250vi n=8 • 1000,2050vi n=16 26
  27. 3.S nguyên cĩ du a. ð ln cĩ du (signedmagnitude) b. Mã bù 1(one’scomplement) c. Mã bù 2(two’scomplement) d. Mã quá N(excessN,biased) 27
  28. a.ð ln cĩ du  Dùng 1bitth hin du: • 0:s dương (+) • 1:s âm ()  (n1)bitcịn li là biu din nh phân ca đ ln X(tr tuyt đi ca X)  Ví d: • X=5,n=4  X=0101 • X=10,n=8  X=10001010 28
  29. ð ln cĩ du (tt)  Khong biu din: (2n1– 1) +(2n1– 1) • n=8: 12710  +12710 • n=16: 3276710  +3276710  Nhn xét:vi n=8 • 00000000=+0 • 10000000=0  ðưc s dng trên các máy tính th h đu,ví d IBM7090 29
  30. b.Mã bù 1  Dùng phép tốn bitwiseNOT (đi bit1thành bit0,bit0thành bit1)đ to s âm.  Ví d:vi n=4 • 0101=+5 • 1010=5 mã bù 1ca 5là 1010  Nhn xét:cĩ 1bitdu(0:dương,1:âm)  Khong biu din: (2n1– 1) +(2n1– 1) • n=8: 12710  +12710 • n=16: 3276710  +3276710 30
  31. Mã bù 1(tt)  Nhn xét:vi n=8 • 00000000=+0 • 11111111=0  ðưc s dng trên các máy tính th h đu,ví d PDP1,UNIVAC1100 31
  32. c.Mã bù 2  Mã bù 2 ca mt s âm bng mã bù 1 cng thêm 1  Ví d:vi n=4 • 0101=+5 • 1010=5 (mã bù 1ca 5là 1010) 1011 (mã bù 2ca 5là 1011)  Nhn xét:cĩ 1bitdu(0:dương,1:âm) 32
  33. Mã bù 2(tt)  Khong biu din: 2n1  +(2n1– 1) • n=8: 12810  +12710 • n=16: 3276810  +3276710  ðưc s dng trên các máy tính hin đi (trong CPU,ngơn ng lp trình) 33
  34. Tìm mã bù 2 X:giá tr cn biu din,n:s bitdùng biu din  Xdương:mã bù 2là biu din nh phân dùng nbitca X • X=5,n=8,mã bù 2ca 5là 00000101  Xâm: • Biu din tr tuyt đi Xdùng nbit • ði bit1thành bit0và bit0thành bit1 • Cng thêm 1 34
  35. Tìm mã bù 2(tt)  Ví d:X=10,n=8 • 5=00001010 • ði 10,01:11110101 • Cng thêm 1:mã bù 2ca 10là 11110110 35
  36. Tìm mã bù 2(tt)  Phương pháp đơn gin cho Xâm • Biu din tr tuyt đi ca Xdùng nbit • Tìm bit1đu tiên t bên phi • ði 10,01tt c các bitbên trái bit1 đã tìm  Ví d:X=10,n=8 • 10=00001010 • Tìm bit1đu tiên t bên phi 00001010 • Mã bù 2ca 10là 11110110 36
  37. Cng s bù 2  Ví d 1: 1111 111 carries 00010111 (23) +11110111 +(9) 0 0 0 0 1 1 1 0 14  Ví d 2:hin tưng tràn (overflow) 01111 carries 01111110 (126) +00001000 +(8) 1 0 0 0 0 1 1 0 ???(122) 37
  38. Xác đnh kt qu phép cng s bù 2  Nu s nh vào (carry in) bng vi s nh ra (carryout)trong phép cng bitdu thì khơng cĩ hin tưng tràn  Nu s nh vào (carry in) khác vi s nh ra (carryout)trong phép cng bitdu thì cĩ hin tưng tràn • Overflow: kt qu phép tốn vưt ra ngồi khong biu din 38
  39. d.Mã quá N  Cịn gi là phương pháp di chuyn (biased)  Mt giá tr nguyên cĩ du X đưc biu din thành mt s nguyên khơng du cĩ giá tr là X+N  Ví d:N=7 mã quá 7,n=4 • Mã quá 7ca 5là 0010 • Mã quá 7ca 5là 1100 39
  40. Mã quá N(tt)  Khong biu din N  +(2n– 1 N) • n=8,N=127: 12710  +12810  Mã quá N dùng trong biu din s du chm đng theo tiêu chun IEEE754 40
  41. Các dng mã hố s nguyên vi n=4 41
  42. Bài tp 3  Cho n=8,tìm mã đ ln cĩ du,mã bù 1,mã bù 2,mã quá 127ca các s thp phân sau đây: • 10,61,102 • 22,55,100 42
  43. III.Biu din s thc 1. Khái nim v s thc 2. S du chm tĩnh 3. S du chm đng 4. Tiêu chun s du chm đng IEEE754 43
  44. 1.Khái nim v s thc  Trc s thc:chia làm 7vùng  Trong khong biu din cĩ vơ s s thc • Ví d:20/3=6.666 • Cĩ th cĩ sai s khi biu din s thc S S âm dương S âm KHONG quá quá KHONG Sdương quá ln BIUDIN nh nh BIUDIN quá ln S 0 44
  45. 2.S du chm tĩnh  Ví d: • +3.2510 ,11.012  Dùng n+m+1bitđ biu din: • 1bitdu (0:dương,1:âm) • nbit:phn nguyên • mbit:phn phân s đúng 1bit nbit mbit Bitdu Phnnguyên Phnphânsđúng 45
  46. S du chm tĩnh (tt)  Sai s tuyt đi:  S dương ln nht:  S dương nh nht: 46
  47. Ví d s du chm tĩnh  X=3.37510,n=7,m=8 • 00000011.011000002 =03.6016  X=7.2510,n=7,m=8 • 10000111.010000002 =87.4016 47
  48. ng dng s du chm tĩnh  Dùng trong các chương trình tính tốn thương mi (các ng dng spreadsheet), và đưc h tr trên mt s ngơn ng lp trình 48
  49. Bài tp 4  Cho n=7,m=8,tìm biu din s du chm tĩnh ca các s thp phân sau đây: • 100.625, 70.3125, 120.4375 49
  50. 3.S du chm đng  X là s bt kỳ, cĩ th phân tích dưi dng: X=m*ae (1) trong đĩ: agi là cơ s (radix) mgi là phn đnh tr (mantissa) egi là phn bc (exponent) 50
  51. S du chm đng (tt)  Ví d: • a=10,X=3.14 X=3.14=0.314*101 =31.4*101 • a=2,X=11.101 1) 10) X=(11.101)2=(1.1101*10 2=(0.11101*10 2  Vi cơ s acho trưc,cĩ nhiu cách phân tích Xtheo dng (1)  V trí ngăn cách gia phn nguyên và phn phân s ph thuc phn bc ekhơng c đnh như trong biu din s du chm tĩnh  biu din s du chm đng 51
  52. S du chm đng (tt)  Nu đt thêm điu kin a1 ≤ |m|<1thì cách phân tích là duy nht:dng chun  Xét li ví d trên: 1 a=10,X=3.1410 =0.314*10 10) a=2,X=(11.101)2=(0.11101*10 2 52
  53. Khái nim FLOPS  Dùng trong đánh giá hiu sut máy tính  FLoatingpointOperationsPerSecond • S tính tốn s du chm đng trong 1giây  Khái nim tương t MIPS • MillionInstructionsPerSecond S lnh thc hin trong mt giây, trong đĩ lnh cĩ th là tính tốn s nguyên, tính tốn s du chm đng,tính tốn lun lý, 53
  54. 4.Tiêu chun s du chm đng IEEE754  Dot chc IEEE(Institude ofElectrical andElectronicEngineers) • M rng thành tiêu chun IEEE854  ðưc s dng ph bin trên các đơn v s du chm đng (FPU, FloatingPoint Unit)trong các b x lý,và trên các ngơn ng lp trình 54
  55. Tiêu chun IEEE754(tt)  Tiêu chun IEEE754gm các dng s chm đng tiêu chun (normalized): • S chính xác đơn – Singleprecision32bit (S single) • S chính xác kép – Doubleprecision64bit (S double) • S chính xác kép m rng – DoubleExtendedprecision80bit(S extended)  S extendeddùng đ gim các li khi làm trịn s và ch dùng bên trong các FPU 55
  56. Tiêu chun IEEE754(tt)  Các s du chm đng IEEE754cĩ dng: X=S*2e trong đĩ: Slà phn đnh tr (significand) elà phn bc (exponent) vi 1.0 ≤ |S|<2 Scĩ th vit thành S=1.f trong đĩ flà phn phân s (fraction) X=± 1.f*2e 56
  57. S chính xác đơn (s single)  S chính xác đơn cĩ 32bit: • 1bitdu(0:dương,1:âm) • 8bitphn bc dùng mã quá 127 • 23bitphn phân s (thuc phn đnh tr) 1bit 8bit 23bit Bitdu Phnbc Phnphâns 57
  58. Ví d s single  X=0.510 • 0.5=1.0*21 • Bitdu:0 • Phn bc:1 mã quá 127ca 1là 1+127=126 12610 =011111102 • Phn đnh tr S=1.0,phn phân s =0  Biu din dangs chính xác đơn ca 0.5: • 00111111000 002 =3F00000016 23BIT0 58
  59. Ví d s single(tt)  X=2010 • 20=1.25*24 • Bitdu:1 • Phn bc:4 mã quá 127ca 4là 4+127=131 13110 =100000112 • Phn đnh tr S=1.25,phn phân s =0.25 0.2510 =0.012  Biu din dangs chính xác đơn ca 0.5: • 110000011010 002 =C1A0000016 21BIT0 59
  60. S chính xác kép (s double)  S chính xác kép cĩ 64bit: • 1bitdu(0:dương,1:âm) • 11bitphn bc dùng mã quá 1023 • 52bitphn phân s (thuc phn đnh tr) 1bit 11bit 52bit Bitdu Phnbc Phnphâns 60
  61. Các đc đim chính ca s single,s double S single S double S bitdu 1 1 S bitphnbc 8 11 S bitphnđnhtr 23 52 Tngs bit 32 64 Biudinphnbc Mãquá 127 Mãquá 1023 Khongphnbc 126 +127 1022 1023 61
  62. Các đc đim chính ca s single,s double(tt) S single S double Giá tr nh nht 2126 21022 Giá tr lnnht ≈ 2+128 ≈ 2+1024 Khongbiudin ≈ 1038 10+38 ≈ 1030810+308 (theothpphân) Giá tr nh nht ≈ 1045 ≈ 10324 (dngsđcbit) 62
  63. Các dng s đc bit S tiêuchun +/ Tùyý 0<exponent<max (Normalized) S khơngchun +/ 0 Tùyý (Denornalized) khác0 Zero +/ 0 0 Vơcc/Vơcùng +/ 11 11 0 (Infinity) NaN +/ 11 11 Tùyý (NotaNumber) khác0 63
  64. Các dng s đc bit (tt)  S dng denormalized dùng đ biu din s rt nh • S nh nht là 223 *2127 =2150  Cĩ th biu din 2s 0(+0,0)  S vơ cc cĩ th dùng làm tốn hng tuân theo các quy tc tốn hc cho s vơ cc  Khi kt qu phép tốn khơng xác đnh,ví d ∞/∞ thì dùng dng NaN (Not a Number) 64
  65. Làm trịn s (rounding)  Tiêu chun IEEE 754 cĩ các dng làm trịn s: • Unbiased:roundtonearest Làm trịn v s gn nht Nu s cn làm trịn gia 2giá tr thì làm trịn v s cĩ bitcui bên phi là 0 • Towardzero:làm trịn v zero • Towardpositiveinfinity:làm trịn v +∞ • Towardnegativeinfinity:làm trịn v ∞ 65
  66. Bài tp 5  ði các giá tr thp phân sau đây sang dng s single(IEEE754),trình bày kt qu dng h 16: • 15.5, 20.5, 34  ði các s dng single sau đây v dng thp phân: • 42E48000H, 3F880000H 66
  67. IV.Biu din ký t 1. Các khái nim 2. ASCII 3. Unicode 4. Ting Vit trên máy tính 67
  68. 1.Các khái nim  Ký t trên máy tính (computercharacter) là đơn v thơng tintương ng vi: • Mt ký hiu âm tit (syllabary) trong dng vit ca ngơn ng t nhiên • Ký t điu khin trong x lý văn bn  Mi ký t đưc mã hố bng mt chui bit và đưc lit kê trong bng mã (characterencodingscheme)hayb ký t (characterset) • Ví d:ASCII,Unicode 68
  69. Lưu tr,x lý và hin th ký t  Mi ký t đưc lưu tr và x lý theo v trí ký t trên bng mã (mã ký t) • Ví d:‘A’ cĩ giá tr 41Htrong mã ASCII  Các ký t cĩ biu din đ ha (glyph) trên các thit b xut (màn hình,máy in)  Font ch (computer font) là file d liu bao gm tp hp các biu din đ ha ca các ký t, ký hiu theo mt dng (typeface) 69
  70. Các thơng s chính ca fontch  Dng ch (typeface) • Ví d:TimeNewRoman  Loi ch (style) • Ví d:Normal,Bold,Italic,BoldItalic  Kích thưc (c)ch • Ví d:12points,24pointsvi pointlà đơn v trong k thut in(1point=1/72inch) 70
  71. Ví d fontch  TimeNewRoman– Bold– 36point  Arial – Bold Italic – 36 point French Script –––Bold –––48 point  Courier New – Normal – 32 point 71
  72. Các đnh dng chính ca d liu fontch  Bitmapfont • Bao gm mt chui các đim nh (pixel) biu din nh ca ký t theo mt dng ch trên mt c ch  Outlinefont • Bao gm các đưng congdng Bézier,các lnh v, các biu thc tốn, cho phép th hin mt dng ch theo kích thưc tùy ý (scalable) 72
  73. TrueTypefont  Là dng Outline font đưc s dng ph bin trên các h điu hành hin đi  Ví d: Windows 2K/XP s dng True Typefontdng OpenType 73
  74. 2.ASCII AmericanStandardCodeforInformationInterchange  Do ANSI (American National Standards Institude) cơng b năm 1967, cp nht năm 1986  Bng mã ASCIIdùng biu din ký t trên máy tính và các thit b truyn thơng 74
  75. Mã ASCII(tt)  Mã ASCII chun dùng 7 bit, biu din đưc 128ký t,bao gm: • Các ký t điu khin (controlcharacters)cĩ giá tr (mã)t 0đn 1Fh • Các ký t inđưc (printablecharacters)cĩ giá tr (mã)t 20h đn 7Fh  Mã ASCIIm rng dùng 8bit,bao gm: • Phn ASCIIchun • Các ký t đc bit cĩ giá tr (mã)t 80hđn FFh 75
  76. Mã ASCIIchun 76
  77. Mã ASCIIm rng 77
  78. 3.Unicode a. Gii thiu Unicode b. Các đc đim chính 78
  79. a.Gii thiu Unicode  Unicodelà tiêu chun mã hĩa ký t ca Hip hi Unicode(UnicodeConsortium) bao gm các nhà sn xut IBM, Apple, HP,MicroSoft,Adobe,  Unicodelà mt hin thc ca chun ISO 10646UCS2(UniversalCharacterSet)  Unicode đưc h tr trên các h điu hành, trình duyt web, các tiêu chun phn mm hin đi như XML, Java, LDAP,CORBA, 79
  80. Gii thiu Unicode(tt)  Mc tiêu ca Unicode là cung cp mã (codepoint)duy nht cho ký t,ký hiu trên tt c các ngơn ng, h thng ch vit (writingsystems) • Vic hin th ký t (font) do chương trình ng dng (web, word processor, ) thc hin  Unicode là mã 16 bit biu din đưc 65536ký t,và cĩ th m rng đn trên 1 triu ký t 80
  81. b.Các đc đim chính  Cĩ các phiên bn Unicode:1.0,1.1,2.0, ,5.0  Cách th hin mã ký t theo Unicode: U+xxxx,vi xlà 1ch s h 16,ví d: • Latin1{U+0080 U+00FF} • LatinExtendedA,B{U+0100 U+024F} • CombiningDiacriticalMarks{U+0300 U+036F} • LatinExtendedAdditional{U+1E00 U+1EFF} • ðơn v tin t Vit Nam(ðng):U+20AB 81
  82. Mã t hp,mã dng sn (d tác) Ví d:ch ,t vit  Mã t hp (combining) • Gm chƠ(U+01A0)và du hi (U+0309) • vit =v+i+e+^+.+t • vit =v+i+ê+.+t  Mã dng sn (precomposed) • Mã U+1EDE • vit =v+i+ +t Cĩ chun đ chuyn đi gia hai dng trên  NFC(NormalizationFormC)  NFD(NormalizationFormD) 82
  83. Các sơ đ mã hĩa chính UTF(UnicodeTransformationFormat)  UTF– 16: • Dng mã hĩa chun,dùng 1hay2s nguyên 16bit • ðưc dùng trong WindowsAPI,.NET,Java  UTF– 8: • Gm 1đn 4byte • ðưc thit k đ tương thích vi mã ASCIIvà các giao thc trên byte • Dùng trên WebBrowsers,EMail 83
  84. Ví d UTF8 Ch Vit MãUnicode16bit MãUTF8 U+1ED2 E1BB92 U+1ED3 E1BB93 U+1EDC E1BB9C ơ U+01A1 C6A1 ư U+01B0 C6B0 U+1EE9 E1BBA9 84
  85. 4.Ting Vit trên máy tính a. Bng mã ting Vit b. Các fontch Vit c. Chương trình bàn phím ting Vit 85
  86. a.Bng mã ting Vit Các nhĩm bng mã ting Vit:  Da trên mã ASCII • Mã 1byte • Mã 2byte  Mã Unicode 86
  87. Mã ting Vit 1byte  Dùng phn mã ASCII m rng đ biu din các ký t ting Vit • Khơng đ vì cn 134mã (Ââ,ðđ, )  Gii quyt bng vic dùng chung mã cho ch thưng và ch hoa (cn 67mã),phân bit bng fontch hoa,ch thưng hoc s dng 6mã trong vùng ASCIIchun  Ví d:TCVN5712(fontABC),BKHCM 1byte,VPS, 87
  88. Mã ting Vit 2byte  Các nguyên âm cĩ du đưc mã hĩa bng 2byte  Ch Vit cĩ du ch hoa, ch thưng trong cùng 1font  Ví d:VNI,BKHCM2byte, 88
  89. Ting Vit trên mã Unicode  Chính ph Vit Namquiđnh dùng tiêu chun TCVN 6909:2001 dùng mã Unicode 16 bit (theo Unicode 3.1) làm chun mã ting Vit trong trao đi thơng tinđin t  Unicodedng dng sn • LatinExtendedAdditional{U+1E00 U+1EFF}  Unicodedng t hp • Latin1{U+0080 U+00FF} • LatinExtendedA,B{U+0100 U+024F} • CombiningDiacriticalMarks{U+0300 U+036F} 89
  90. b.Các fontch Vit  Các dng mã 1bytevà 2bytecn cĩ các fontch tương ng.Ví d: • ABC,BKHCM2byte,VNI,  Mã Unicodedùng các fontch doh điu hành và các phn mm h tr 90
  91. c.Chương trình bàn phím ting Vit  Keyboarddriver • Chương trình điu khin bàn phím • Chương trình bàn phím • B gõ  Nhn chui phím theo quy đnh cách nhp (input method) ting Vit, chuyn đi thành mã ký t Vit theo bng mã xác đnh 91
  92. Chương trình bàn phím ting Vit (tt)  Windows • Unikey,VietKey,WinVNkey,  Linux • X Unikey,xvnkb  MACOS • TCVN/VNI/Telexkeyboardlayouts 92
  93. Các cách nhp ting Vit thơng dng  VNI • Vie65tNamd9a61t nu7o7c1to6io7i  Telex • Vieetj Namddaats nwowcs tooi owi  VIQR • Vie^.t Namdda^’t nu+o+’c to^i o+i 93
  94. V.D liu âm thanh,hình nh 1. D liu âm thanh (audio) 2. D liu hình nh (images,graphics) 3. D liu hình nh đng (video) 94
  95. 1.D liu âm thanh  Con ngưi cm nhn âm thanh do sĩng âm tác đng trên tai,và taitruyn tín hiu lên não  Thit b loa to âm thanh docác tín hiu đin dng tương t (analog)  Khi s hĩa d liu âm thanh thì s đnh kỳ đo đin áp tín hiu và lưu li trên các giá tr s thích hp • Sampling:Quá trình ly mu 95
  96. Ly mu âm thanh 96
  97. Ly mu âm thanh (tt)  Âm thanh nghe đưc • 20Hz 20000Hz  V nguyên tc, tc đ ly mu khong 40000ln/giây là cĩ th lưu tr,phc hi âm thanh vi cht lưng tt 97
  98. Các đnh dng fileâm thanh thơng dng  Dng khơng nén (uncompressed) • PCM(PulseCodeModulation) • Dng file.wav  Dng nén mt d liu (lossy compression) • MPEG1layer3(MP3),Vorbis,lossy WindowsMediaAudio(WMA)  Dng nén khơng mt d liu (lossless compression) • Applelossless,losslessWMA 98
  99. 2.D liu hình nh  Mt ngưi phân bit màu sc da trên tn s ánh sáng tác đng trên võng mc  Võng mc cĩ các t bào nhn màu sc theo ba nhĩm chính:Red,Green,Blue  Màu sc biu din trên máy tính thưng da trên các giá tr R,G,Bth hin thành phn ca các màu cơ bn 99
  100. Ví d màu theo RGB 100
  101. Biu din màu sc  Color depth: s lưng d liu dùng đ biu din màu • HiColor:16bit,TrueColor:32bit  Mt chương trình ng dng cĩ th ch th hin mt s lưng màu hn ch theo color palette(bng màu) 101
  102. D liu hình nh  Bao gm tp hp các đim nh (pixel)  Resolution (đ phân gii): s đim nh th hin mt hình nh • 800x600 • 1024x800 102
  103. Rastergraphicformat  D liu hình nh đưc lưu da trên thơng tin các đim nh:rastergraphicformat  Các đnh dng filethơng dng: • BMP(BitMaP),dng uncompressed • GIF(GraphicInterchangeFormat) dng losslessdatacompression • PNG(PortableNetworkGraphics) dng losslessdatacompression,thay th dng GIF • JPEG(JointPhotographicExpertsGroup) dng lossy datacompression 103
  104. Vectorgraphicformat  D liu hình nh đưc lưu theo các dng hình hc (đim, đưng thng, đưng cong, ) và màu sc: vector graphic format  Hình nh dng vectorgraphiccĩ th thay đi kích thưc theo tốn hc  Khơng phù hp cho hình nh thc 104
  105. Vectorgraphicformat(tt)  Các đnh dng filethơng dng • swf (SmallWebFormat/ShockWave Flash) • ps (PostScript) • wmf (WindowsMetafile) • pdf (PortableDocumentFormat) 105
  106. 3.D liu hình nh đng  Hình nh đng (video)bao gm các hình nh liên tc  Thơng s chính:framespersecond • Phim:24frames/sec  VideoCodec (COmpressor/DECompressor):là phương pháp chuyn hình nh đng thành d liu trên máy tính 106
  107. D liu hình nh đng (tt)  Hu ht các videocodecđu là dng nén mt d liu (losslesscompression)  Cĩ 2dng nén chính • Temporal: da trên s khác nhau gia các frameliên tc • Spatial:da trên d liu cĩ trên tng frame (tương t nén nh tĩnh) 107
  108. Các đnh dng filethơng dng  Containerformat:đnh dng filenén theo các codec  Các đnh dng containerthơng dng: • avi (chun trên Windows) • asf (dùng cho WMA,WMV) • mov (Quicktime container) • Mpeg2,Mpeg4(MovingPictureExpertsGroup) • RealMedia (dùng cho RealVideo,Realaudio) • DivX mediaformat 108