Wiktionary:Bảng tần số/Tiếng Việt

Từ điển mở Wiktionary
Buớc tưới chuyển hướng Bước tới tìm kiếm

Tần số chữ theo Truyện Kiều[sửa]

python normalize.py -f kieu.txt -i -w | sed 's/./&~/g' | tr '~' '\012' | \
sort -n | uniq -c | sort -nr
Chữ quốc ngữ
Chữ Lần xuất hiện % xuất hiện
n 10063 13,3
a 6550 8,7
h 6211 8,2
i 5602 7,4
g 5252 6,9
t 4877 6,4
c 3522 4,7
u 2971 3,9
o 2951 3,9
ơ 2526 3,3
m 2497 3,3
ư 2343 3,1
â 2219 2,9
ê 2150 2,8
ô 1868 2,5
đ 1800 2,4
y 1629 2,2
l 1553 2,1
r 1549 2,0
ă 1107 1,5
b 1046 1,4
v 884 1,2
s 822 1,1
d 732 1,0
e 720 1,0
k 712 0,9
p 692 0,9
x 481 0,6
q 295 0,4
Tổng cộng 75624 100
Chữ Latinh cơ bản
Chữ Lần xuất hiện % xuất hiện
n 10063 13,3
a 9876 13,1
o 7345 9,7
h 6211 8,2
i 5602 7,4
u 5314 7,0
g 5252 6,9
t 4877 6,4
c 3522 4,7
e 2870 3,8
d 2532 3,3
m 2497 3,3
y 1629 2,2
l 1553 2,1
r 1549 2,0
b 1046 1,4
v 884 1,2
s 822 1,1
k 712 0,9
p 692 0,9
x 481 0,6
q 295 0,4
Tổng cộng 75624 100