Trợ giúp:Unicode

Từ điển mở Wiktionary

Trong Wiktionary, các mục từ Unicode cũng được xem là các mục từ hợp lệ trong cuốn từ điển mở này. Các mục từ Unicode thường sẽ mô tả ngôn ngữ sử dụng (nếu có), nguồn gốc, mức độ phổ biến, cách sử dụng… và đôi khi là các ký tự liên quan hoặc giống với ký tự đó.

Hiện nay, Unicode vẫn luôn được cập nhật thêm các ký tự mới; và do đó, số lượng mục từ Unicode bạn có thể tham gia đóng góp sẽ tăng lên. Tuy nhiên, khả năng hiển thị các ký tự Unicode của các thiết bị là không giống nhau.

Trang này sẽ hướng dẫn bạn cách để dễ dàng đóng góp cho mảng Unicode của Wiktionary. Đối với việc đóng góp cho các mục từ chữ Nôm nói riêng, xem Trợ giúp:Chữ Nôm.

Bằng việc đóng góp một mục từ Unicode cho một hệ chữ mới, bạn đã mở ra thế giới ngôn ngữ đa dạng và phong phú!

Trước khi đóng góp cho mảng Unicode…[sửa]

…hãy kiểm tra thiết bị của bạn![sửa]

Hãy kiểm tra xem thiết bị bạn đang dùng để sửa đổi có hỗ trợ nhiều ký tự Unicode hay không. Nếu không có font chữ hỗ trợ, các ký tự sẽ hiện ra trong trình duyệt của bạn thành các ô vuông (⎕), ô vuông chứa dấu hỏi (⍰), ô vuông bị gạch chéo (〿), ô vuông chứa mã số hay hiển thị sai thành các ký tự khác.

Bạn có thể nhấn vào liên kết này để tải bộ font chữ hỗ trợ nhiều ký tự Unicode khác nhau (dành cho Windows).

Nhận diện loại ký tự[sửa]

Bạn cần nhận diện đúng loại ký tự khi tạo các mục từ Unicode.

  • Một mục từ Unicode được gọi là không nhìn thấy được khi ký tự đó không thể dùng trỏ chuột để sao chép trực tiếp ký tự đó. Dấu cách dù là ký tự không nhìn thấy được, nhưng nó vẫn có thể sao chép trực tiếp bằng trỏ chuột.
  • Một mục từ Unicode được gọi là có nhiều biến thể khi ký tự đó có nhiều cách hiển thị khác nhau khi sử dụng các thiết bị/font chữ khác nhau. Các ký tự emoji và một số rất ít ký tự khác luôn luôn thuộc loại ký tự này.[ghi chú 1]
  • Các ký tự có dấu chấm tròn (◌) là những ký tự kết hợp. Chúng thường được sử dụng để đặt lên các ký tự khác. Ví dụ, x⃕ sẽ cho x⃕.

Cách đóng góp cho mảng Unicode[sửa]

Khi tạo một mục từ Unicode, bạn cần đảm bảo rằng bạn viết một định nghĩa phù hợp cho mục từ, tốt nhất là nên kèm theo chú thích tham khảo. Chỉ có mục từ Unicode không có định nghĩa rõ ràng. Các mục ký tự không có định nghĩa thích hợp có thể bị xóa.

Vui lòng đọc toàn bộ phần này để có một mục từ Unicode đầy đủ.

Cấu trúc[sửa]

Cấu trúc của một mục từ có thể như sau:

{{- ngôn ngữ của mục từ theo ISO 639-3; nếu   tự được dùng cho mục đích chung, dùng mul-}}
{{character info}}
{{-desction-}}
( tả  tự, nếu  thể)

{{-pron-}}
(Cách phát âm của mục từ. Nếu  chữ của một quốc gia, nên  mục này)

{{-từ loại của mục từ, nếu   tự được dùng cho mục đích chung, dùng symbol; nếu  chữ đơn lẻ, dùng letter; nếu  hệ chữ dùng âm tiết, dùng syllable-}}
{{pn}}
#(Nghĩa 1 của mục từ)
#(Nghĩa 2 của mục từ)
#…
#(Nghĩa 𝑛 của mục từ)

{{-usage-}}
(Ghi chú sử dụng, không nhất thiết cần  mục này)

{{-see-}}
(Thêm vào các mục từ liên quan, bao gồm các mục từ không liên quan đến Unicode.  thể liên kết thêm 1 số bài viết về Unicode trên Wikipedia.)

{{-ref-}}
(Nếu   tự ít gặp, cần chú thích; chỉ cần chèn <ref></ref> vào vị trí cần chú thích)

[ghi chú 2]

Quy tắc tạo mục từ này có thể không áp dụng được đối với tất cả các mục từ Unicode.

{{character info}}[sửa]

Bản mẫu:character info là một bản mẫu có cấu trúc khá phức tạp. Mỗi khi được thêm vào một mục từ Unicode, nó sẽ tự động hiện các dữ liệu dưới đây.

  • Mã ký tự
  • Mã HTML của ký tự (dưới dạng số thập phân)
  • Tên ký tự chính thức
  • Ảnh (nếu có)

Ảnh[sửa]

Thông thường, việc thêm ảnh tham khảo vào một mục từ Unicode là không bắt buộc, trừ những ký tự chưa có sẵn trên tất cả các thiết bị hiện hành (hoặc rất ít).

Xem hướng dẫn thêm ảnh tham khảo vào một mục từ Unicode tại Trợ giúp:Unicode/Ảnh.

Bản mẫu[sửa]

Để giúp hỗ trợ trong việc quản lý cũng như thông báo người đọc, các bản mẫu Unicode sẽ được sử dụng cho nhiều mục đích khác nhau. Một danh sách như vậy có thể được tìm thấy tại Thể loại:Bản mẫu Unicode.

Thể loại[sửa]

Các thể loại mục từ Unicode có dạng “[[Thể loại:Khối ký tự <tên khối ký tự>]]”. Để thuận tiện cho việc tra cứu thể loại, bạn cần phải thêm mã “[[Thể loại:Khối ký tự <tên khối ký tự>|𝑥 chữ số cuối của mã ký tự Unicode]]”. Quy tắc viết giá trị 𝑥 như sau:

  • Khối ký tự có số lượng ≤ 256 ký tự: Lấy 𝑥 = 2, tức là 2 chữ số cuối của mã ký tự Unicode.
  • Khối ký tự có số lượng từ 256 đến dưới 4096 ký tự: Lấy 𝑥 = 3, tức là 3 chữ số cuối của mã ký tự Unicode.

Ví dụ cho “₹” (U+20B9), bạn nhập “[[Thể loại:Khối ký tự Currency Symbols|B9]]”.

Ký tự “👓” (U+1F453), bạn nhập “[[Thể loại:Khối ký tự Miscellaneous Symbols and Pictographs|453]]”.[ghi chú 3]

Việc xếp thể loại này không nên được dùng ở các thể loại chữ Hán/chữ Nôm.

Tìm các ký tự liên quan[sửa]

Để tìm được các ký tự liên quan, bạn có thể xem tại đây. Chú ý vì số lượng ký tự rất cao; do đó, bạn hãy sử dụng chức năng tìm kiếm trên trình duyệt của bạn để tìm được các ký tự liên quan.[ghi chú 4]

Chú thích tham khảo[sửa]

Khi một ký tự Unicode được mã hóa, có thể ký tự đó sẽ phải có ít nhất một cách sử dụng. Để tìm ra cách sử dụng của ký tự, bạn có thể tìm trong danh sách này.[ghi chú 5]

Xem thêm[sửa]

Còn thắc mắc? Mời vào:


Ghi chú[sửa]

  1. Cần chú ý, hầu hết các ký tự (như các chữ Latin) có thể có các cách hiển thị hơi khác biệt; tuy nhiên, ký tự đó vẫn được xem là chỉ có một biến thể duy nhất.
  2. Thực ra, mã “{{character info}}” phải được đặt ở đầu; tuy nhiên, do các hạn chế kỹ thuật, bản mẫu này cần được đặt sau bản mẫu đề mục cấp 2.
  3. Thực ra, mã “{{character info}}” sẽ tự động xếp mục từ vào đúng thể loại tương ứng của ký tự. Tuy nhiên, cách sắp xếp mặc định có thể gây khó khăn trong việc tra cứu ký tự.
  4. Danh sách trên không phải là danh sách đầy đủ.
  5. Bạn có thể tìm ra cách sử dụng của ký tự bằng các công cụ tìm kiếm, điều này sẽ cho kết quả nhanh hơn.