Thành viên:Tildebot

Từ điển mở Wiktionary
Bước tới: dẫn lái, tìm
bot
Chủ nhân Nguyễn Xuân Minh
Thư viện / khuôn khổ pywikipediabot
Ngôn ngữ lập trình Python
Môi trường / hệ điều hành Mac OS X 10.4
29 tháng 4, 2007
197.598

Minh đã mỏi tay vì gõ quá sức. Hình như tôi phải giúp đỡ.

Nuvola apps korganizer.png

Việc cần làm[sửa]

Đây là danh sách các việc mà tôi định sẽ làm. Nếu bạn muốn tôi làm gì nữa, xin nhắn tin cho Minh hay ghi nó thẳng vào đây.

Tìm và thay[sửa]

Tiến triển Miêu tả Mã nguồn cũ Mã nguồn mới
Việc làm hiện nay
Việc đang ngừng
Recycle001.svg FVDP: Dời liên kết. Dời liên kết khỏi những từ thường gặp.
27 tháng 1, 2008
Recycle001.svg Thêm phần chuyển tự vào các mục từ tiếng Nga. Đã làm phần lớn, nhưng cần phải sửa các từ không có trọng âm.
19 tháng 7, 2007 –
\{\{-rus-\}\}
(?![\r\n]+\{\{-translit-|[\r\n]+\{\{-rus-trans-)
(?=.*[\r\n]'''([^\r\n]*<u>.</u>[^\r\n]*)''')
lambda x: "{{-rus-}}\n{{-rus-trans-|" + "|".join(x.group(1).replace("<u>", "'").replace("</u>", "")) + "}}\n"
Recycle001.svg FVDP: Cụm từ. Sửa các lỗi đặt liên kết cho từ ghép.
22 tháng 6 – 2 tháng 7, 4 tháng 7, 8 tháng 7, 15 tháng 7 – 17 tháng 7, 2007
Việc làm trong tương lai
00%.svg @. Viết các biểu thức chính quy để đổi tiêu bản {{term}} thành {{@}}.
00%.svg FVDP: Viết hoa các mục từ trong thể loại Thể loại:Viết tắt tiếng Anh và thay dòng cho biết cách đánh vần trong các mục từ đó.
00%.svg FVDP: Sửa những thông tin biến cách đã có trong dữ liệu FVDP để sử dụng tiêu bản. '''([^']*)''' \(''số nhiều'': \[\[[^']*\]\]\) {{eng-noun|pl=\2}}
'''([^']*)''' \(Số nhiều: \[\[[^']*\]\]\)
'''([^']*)''' \(\{\{plur\}\} ([^\)]*)\)
{{eng-verb|...}} tại en:
Việc đã làm xong
100%.svg Thay các liên kết đến w:IPA bằng Wiktionary:IPA.
30 tháng 4, 2007 – 21 tháng 5, 2007
* [[w:IPA|IPA]] : * [[Wiktionary:IPA|IPA]]:
*[[w:IPA|IPA]] :
100%.svg FVDP: Sửa lỗi xếp thể loại thường gặp trong các mục từ liên từ FVDP.
6 tháng 6, 2007
^conjonction[\r\n]+(.+)tiếng ([^\]]+)\]\] \\1tiếng \\2]]\n[[Thể loại:Liên từ tiếng \\2]]
tiếng ([^\]]+)\]\][\r\n]*conjonction tiếng \\1]]\n[[Thể loại:Liên từ tiếng \\1]]
100%.svg FVDP: Sửa những vấn đề quan điểm thường gặp trong định nghĩa của FVDP.
6 tháng 6, 2007
[[nước]] [[ta]] [[Việt Nam]]
100%.svg FVDP: Mở rộng những chú thích cho biết vị trí của định nghĩa
6 tháng 6, 2007 (làm bằng tay)
[TN] {{term|trong nước}}
[ĐL] {{term|Đài Loan}} (?)
100%.svg FVDP: Hợp nhất những định nghĩa bị PiedBot cắt ra từng dấu chấm phẩy.
6 tháng 6, 2007 – 10 tháng 6, 2007
^\# ((?:\{\{term\|[^\}]*\}\} *|; *|\([^\)]*\) *)*
(?:\[\[[^\]]*\|[^\]]*\]|[A-ZÀÁẢÃẠÂẦẤẨẪẬĂẰẮẲẴẶĐÈÉẺẼẸ
ÊỀẾỂỄỆÌÍỈĨỊÒÓỎÕỌÔỒỐỔỖỘƠỜỚỞỠỢÙÚỦŨỤƯỪỨỬỮỰỲÝỶỸỴ])
[^\r\n]*[^\.\r\n])[\r\n]+\# (\[\[[^\|]*\]|[^A-Z
ÀÁẢÃẠÂẦẤẨẪẬĂẰẮẲẴẶĐÈÉẺẼẸÊỀẾỂỄỆÌÍỈĨỊÒÓỎÕỌÔỒỐỔỖỘƠỜỚỞỠỢ
ÙÚỦŨỤƯỪỨỬỮỰỲÝỶỸỴ])
# \1; \2
100%.svg FVDP: Thay {{-verb-}} bằng {{-tr-verb-}}, {{-intr-verb-}}, và {{-aux-verb-}}.
9 tháng 7, 2007 – 15 tháng 7, 2007
^\{\{-verb-\}\}[\r\n]+([^\r\n]*ngoại động từ) {{-tr-verb-}}\n\\1
^\{\{-verb-\}\}[\r\n]+([^\r\n]*nội động từ) {{-intr-verb-}}\n\\1
^\{\{-verb-\}\}[\r\n]+([^\r\n]*trợ động từ) {{-aux-verb-}}\n\\1
100%.svg Thay {{-pr-noun-}} bằng {{-place-}} trong các mục địa danh tiếng Việt.
2 tháng 9 – 3 tháng 9, 2007
\{\{-pr-noun-\}\}(?=[\r\n]+'''[A-Z
ÀÁẢÃẠÂẦẤẨẪẬĂẰẮẲẴẶĐÈÉẺẼẸÊỀẾỂỄỆÌÍỈĨỊÒÓỎÕỌÔỒỐỔỖỘƠỜỚỞỠỢ
ÙÚỦŨỤƯỪỨỬỮỰỲÝỶỸỴ].*[\r\n]+# [^\r\n]*(?:Một|\[\[một
\|Một\]\]|\[\[tên gọi|Tên gọi\]\] các) \[\[(?:làng|thị|xã|phường|thành|phủ|quận|huyện|tỉnh|sông|núi
|hồ|vịnh|đảo|quần|dòng))
\\1[[Thể loại:Địa danh tiếng Việt]]
(\{\{-place-\}\}.*)\[\[Thể loại:Danh từ riêng tiếng Việt\]\] [[Thể loại:Địa danh tiếng Việt]]
100%.svg FVDP: Thay Thể loại:Tiếng Pháp bằng Thể loại:Mục từ tiếng Pháp. Xây dựng Thể loại:Tự động từ tiếng Pháp.
9 tháng 9 – 12 tháng 9, 2007, 18 tháng 9, 2007
\[\[Thể loại:Tiếng Pháp\|([^\]]*)\]\][\r\n]+(?=.*\[\[Thể loại:Tiếng Pháp\|)
\[\[Thể loại:Tiếng Pháp\|([^\]]*)\]\] [[Thể loại:Mục từ tiếng Pháp|\\1]]
\{\{-verb-\}\}(?=[\r\n]+'''[^\r\n]+tự động từ) {{-ref-verb-}}
(\{\{-ref-verb-\}\}.*)\[\[Thể loại:Động từ
tiếng Pháp\|([^\]]+)\]\]
\\1[[Thể loại:Tự động từ tiếng Pháp|\\2]]
100%.svg Đổi các tiêu bản ngôn ngữ ISO theo dạng {{xxx}} để sử dụng {{tiếng}}.
28 tháng 9
^[^<]+
import re
def langdelink_repl(x):
    nolink = re.sub(r"\[\[([^\|\]]+)(?:\|[^\]]+)?\]\]", r"\1", x.group(0))
    plain = nolink.replace("''", "").replace("'''", "")
    lc = re.sub(r"^\[\[([^\|\]]+)(?:\|[^\]]+)?\]\]", r"[[\1]]", x.group(0))
    result = u"{{tiếng|style={{{style|}}}|%(default)s|plain=%(plain)s|nolink=%(nolink)s|lc=%(lc)s}}" % \
             {"default": x.group(0), "plain": plain, "nolink": nolink, "lc": lc}
    return result
plain=(?P<plain>[^\|]+)\|nolink=(?P=plain)\| plain=\g<plain>|
100%.svg @. Tập hợp lại các lần gọi {{term}} ở đây để biết cần tại ra tiêu bản @ nào. Xem {{@}}.
5 tháng 11, 2007 – 12 tháng 11, 2007
100% Thay thế {{VieIPA}} bằng {{vie-pron}}
11 tháng 9, 2011 – 2 tháng 10, 2011
(?mu)^\* *\[\[(?:.*?IPA\|)?IPA\]\]: *
\{\{IPA\|/((?:\{\{ *VieIPA *[|\w]+\}\} *)+)/\}\} *(\r$)
import re
def replaceVieIPA(match):
    ipa = match.group(1)
    words = re.split(r'\}\} +\{\{ *VieIPA *\|',
                     ipa.strip()[ipa.find('|')+1:-2])
    words = [word.replace('|', '') for word in words]
    return "{{vie-pron|%s}}" % "|".join(words)
75%.svg FVDP: Các mục từ có / trong tham số của {{nor-noun}}{{nor-verb}}, như dropskjede. Đã làm bằng tay, chỉ cần kiểm lại dùng bot để chắc chắn. Các bản mẫu hiện có khả năng phân tích các dấu phân tách.

Tạo mới[sửa]

Tiến triển Miêu tả Nguồn
00%.svg Các địa danh Việt Nam. Đã bỏ dữ liệu vào CSDL; cần viết mục từ mẫu và tìm cách để nhận ra nếu tên không tuân theo chính tả tiếng Việt, để khỏi bể tiêu bản {{VieIPA}}. NGA/GNS
00%.svg Các địa danh Hoa Kỳ. Đã bỏ dữ liệu của tiểu bang Ohio vào CSDL; cần viết mục từ mẫu và tập hợp các thành viên lớn hay quan trọng hơn trùng với địa danh Ohio, như là Toledo (Ohio vs. Tây Ban Nha). USGS/BGN
00%.svg Phần FVDP còn lại. PiedBot bỏ qua nhiều bài vì những lý do nhỏ. Sẽ cần liệt kê dứt khoát những vấn đề phải giải quyết trước khi nhập những bài này vào đây. FVDP

Chưa xếp[sửa]

phải trở thành:
  1. Toàn bộ nói chung những vật rời được lại với nhau
    Một hoa.
    đuốc.
  • Và ngược trở lại, cũng có một số định nghĩa trong mục từ địa danh bị cắt đứt vì có dấu chấm. Điều này sẽ khó giải quyết hơn.
  • Những mục từ kinh tế "mèo Xiêm" có hai thuật ngữ trong một mục từ.
  • {{see-entry|xxxx|Xxxx}}, {{like-entry|xxxx|Xxxx}}
  • & phó từ (thí dụ swift)
  • (Số nhiều: [[xxx]] hoặc [[yyy]]) (như ở terrarium)
  • Xếp các từ vần (rhyming) theo âm tiết cuối.
  • <nghia den><b?ng>", "(econ)", "<nhạc>", "<bóng>", "<thgt>", "[[<Mỹ>|<Mỹ>]]", "<qsự>", "<hải>"
  • Dời các liên kết đến Wiktionary tiếng Klingon (tlh) đã đóng cửa.
  • Đánh dấu các mục từ chỉ đến nhau một cách tuần hoàn dùng {{see-entry}} hay {{like-entry}}.
  • lânh đạo, lânh đạm, etc.