Giải sách bài tập Tin học 10 Bài 3: Một số kiểu dữ liệu và dữ liệu văn bản
Câu 3.1 trang 9 SBT Tin học 10: Việc phân loại các kiểu dữ liệu căn cứ chủ yếu vào tiêu chí nào?
A. Cách mã hoá.
B. Cùng chung các phép xử lí dữ liệu cơ bản.
C. Cả A và B đều đúng.
D. Cả A và B đều sai.
Trả lời:
Đáp án đúng là: B
Về cơ bản theo phép toán xử lí dữ liệu. Dữ liệu được mã hoá thống nhất để có thể xây dựng các phép xử lí trên cơ sở mã hoá. Việc mã hoá có mục đích thống nhất và tạo thuận lợi cho xử lí.
Trả lời:
Một số ví dụ dữ liệu trong học bạ và kiểu của chúng:
- Kiểu văn bản: họ và tên, địa chỉ, tên trường.
- Kiểu số nguyên: ngày, tháng, năm sinh.
- Kiểu số có phần lẻ (phần thập phân): điểm trung bình môn.
- Kiểu ảnh: ảnh học sinh, dấu của trường, chữ kí của giáo viên.
Trả lời:
Kiểu dữ liệu của QR code thuộc loại hình ảnh, nó được xử lí ban đầu với vai trò là hình ảnh, từ đó mới ra xâu kí tự.
Trả lời:
Biểu diễn của xâu kí tự "Computer" trong bảng mã ASCII mở rộng:
01000011 01101111 01101101 01110000 01110101 01110100 01100101 01110010
Câu 3.5 trang 9 SBT Tin học 10: Tìm hiểu 32 kí tự đầu tiên của bảng mã ASCII theo những gợi ý sau:
- Chúng được sử dụng với mục đích gì?
- Các kí tự đó có "mặt chữ" không? Hình ảnh trong ô là các kí tự Latinh (Ví dụ EOT, CR, ...) có phải là "mặt chữ" không?
Trả lời:
- Trong bảng mã ASCII, 32 kí tự đầu tiên là các mã điều khiển. Chúng không được gán mặt chữ. Chúng có tên riêng theo chức năng của mình. Ví dụ kí tự số 10 LF (line feet) sẽ chuyển con trỏ văn bản xuống dòng mới, còn kí tự số 13 CR (carriage return) sẽ đưa con trỏ về đầu dòng. Khi soạn thảo văn bản mà ta nhấn phím thì phần mềm soạn thảo sẽ tự động chèn cả 2 kí tự này vào văn bản mà chúng ta không nhìn thấy vì chúng không có ảnh. Kết quả là khi nhấn Enter em thấy con trỏ văn bản chuyển về đầu dòng mới.
- Nếu dùng mã điều khiển để làm mã kí tự thì phải gán mặt chữ cho nó. Ví dụ bộ mã tiếng Việt TCVN/5712:1993, còn gọi là bộ mã VSCII đã làm như vậy. Tuy nhiên việc lạm dụng có thể gây những hiệu ứng sai lệch. Ví dụ mã số 2 là STX (Start of Text) là mã báo bắt đầu truyền từ chữ tiếp theo cho đến khi gặp mã số 4 EOT (End of Text) thì ngừng truyền. Trong bảng mã VSCII dùng mã số 2 cho "Ụ", còn mã số 4 cho "Ừ", nên nếu truyền đi một dòng chữ có 2 kí tự Việt này, một số phần mềm sẽ hiểu sai.
Trả lời:
Mặc dù có thể xếp toàn bộ chữ Việt trong bảng 256 vị trí nhưng vẫn cần sử dụng Unicode Vì các lí do sau:
- Phải lấy thêm chỗ ở vùng mã điều khiển, có thể gây ra các bất cập như ví dụ câu 3.5.
- Thống nhất kí tự Việt trong tổng thể các kí tự chung của toàn thế giới, đặc biệt chúng ta luôn có nhu cầu sử dụng nhiều ngôn ngữ trong cùng một ứng dụng.
Câu 3.7 trang 9 SBT Tin học 10: Unicode mã hoá mỗi kí tự bởi
A. 1 byte.
B. 2 byte
C. 4 byte.
D. Từ 1 đến 4 byte.
Trả lời:
Đáp án đúng là: D
UTF-8 là một trong các hệ thống định dạng chuyển đổi cho phép mã hóa kí tự với độ dài khác nhau (từ 1 byte đến 4 byte) dành cho Unicode.
Câu 3.8 trang 9 SBT Tin học 10: Unicode đủ mã cho bộ chữ toàn cầu. Tại sao người ta lại dùng UTF?
Trả lời:
- Khi có Unicode, đã có rất nhiều ứng dụng sử dụng các loại mã khác, đặc biệt là ASCII 8 bit. Các ứng dụng xử lí văn bản như thư điện tử, soạn thảo, cơ sở dữ liệu dùng với ASCII và một số bảng mã khác đã tồn tại từ trước đó để lại một khối lượng dữ liệu khổng lồ, không thể vứt bỏ. Việc sửa các phần mềm chỉ sử dụng Unicode có nghĩa là sẽ mất rất nhiều dữ liệu. Mặt khác, khi dùng Unicode thì khối lượng lưu trữ cho dữ liệu văn bản sẽ tăng hơn hai lần.
- Vì thế cần có một cách mã hoá đồng thời Unicode và một số bảng mã khác, đặc biệt là ASCII để có thể sử dụng được các dữ liệu cũ và không nhất thiết phải dùng mã nhiều byte trong các ứng dụng phổ biến để tiết kiệm lưu trữ.
- UTF là cách giải quyết các yêu cầu trên. Vì thế UTF cũng được coi là đối tượng của Unicode (Unicode Transformation Format).
Xem thêm các bài giải SBT Tin học lớp 10 Kết nối tri thức hay, chi tiết khác:
Bài 1: Thông tin và xử lí thông tin
Bài 2: Vai trò của thiết bị thông minh và tin học đối với xã hội