Thảo luận Thành viên:Cumeo89/2007

Từ điển mở Wiktionary
Buớc tưới chuyển hướng Bước tới tìm kiếm

Re: Từ[sửa]

Cám ơn bạn về các từ ghép. "Manh động" chỉ xuất hiện ba lần trong cả wiki, cho nên bạn đã sửa nó bằng tay xong. – Nguyễn Xuân Minh (thảo luận, đóng góp) 05:36, ngày 16 tháng 7 năm 2007 (UTC)

Không sao đâu. Tôi chỉ nói vậy để bạn biết thôi; đôi khi tôi làm những việc của robot bằng tay vì tiện hơn, không cần mở lên những tập tin configuration. Tildebot có một trang dành cho các từ ghép này, nhưng bạn có thể nhắn tiếp vào trang thảo luận của tôi nếu muốn. – Nguyễn Xuân Minh (thảo luận, đóng góp) 06:08, ngày 16 tháng 7 năm 2007 (UTC)

Re: English Wiktionary[sửa]

Chúng ta đã có phép sử dụng nó; xem Wiktionary:Nguồn gốc/FVDP. Vấn đề không phải là giấy phép đâu; từ điển Việt-Anh của FVDP có rất nhiều lỗi chính tả, đến độ mà tôi thường gặp những mục từ không hiểu nổi. Từ điển Đức-Việt cũng có vấn đề này, nhưng từ điển Việt-Anh cũng có vấn đề không được format đúng. Phần nhiều mục từ chỉ là một vài từ; nó thiếu từ loại, và nhiều khi các định nghĩa không được đánh dấu chấm. Tuy tôi không dám nhập các mục từ Việt-Anh vào Wikipedia tiếng Anh dùng robot, nhưng bạn vẫn có thể nhập nó vào bằng tay và "wiki hóa" nó. Tôi đã làm vậy cho một số mục từ, nhưng thực sự dịch từ những mục từ Việt-Việt ở đây thì chắc có lý hơn đối với nhiều mục từ. – Nguyễn Xuân Minh (thảo luận, đóng góp) 04:43, ngày 19 tháng 7 năm 2007 (UTC)

OVDP[sửa]

Hôm nay tôi mới gặp đến dự án OVDP và đọc tí về các vấn đề hợp nhất hai dự án OVDP và Wiktionary tiếng Việt. Điều uổng lắm là vì vấn đề bản quyền và cú pháp wiki ở đây, chúng ta thực sự không được nhập nội dung OVDP vào đây và họ không được nhập nội dung Wiktionary vào đấy. :^\ Mã wiki đã giúp các dự án Wikimedia nhiều, tại vì không cần biết ngôn ngữ lập trình như Java, PHP, hay Python để cộng thêm tính năng; vậy mà tôi cũng thấy mã wiki là phần hạn chế nhất của Wiktionary.

Hệ thống tiêu bản có thể giúp cấu trúc hóa các mục từ và làm tiện cái việc thay đổi nhiều mục từ cùng lúc, nhưng vẫn khó làm tất cả mọi mục từ gọn gàng. Đó là lý do tôi cũng đôi khi bổ sung vào OmegaWiki. Họ đang chuyên biệt MediaWiki để hoạt động giống hơn một cơ sở dữ liệu, và hỗ trợ dữ liệu có cấu trúc. (Điều đó cũng có nghĩa là bạn cần biết PHP nếu muốn thêm tính năng vào dự án đó.)

Lý do tôi vẫn còn tốn nhiều thì giờ ở đây thay vì ở OVDP hay OmegaWiki là bởi vì Wiktionary không chỉ có mục đích cung cấp định nghĩa và ví dụ; Wiktionary có mục đích sử dụng mã wiki để chế và sử dụng các tính năng như {{VieIPA}}, {{-rus-trans-}}, {{etym-from}}, và các bảng chia động từ và biến cách.

Tôi nghĩ OVDP thực sự có một công cụ rất hữu ích, chỉ không thích là một số từ điển được "viết" bằng phương pháp word association, chẳng hạn từ họ dịch camisa ("áo" trong tiếng Tây Ban Nha) thành "chọc tức ai", tại vì từ điển Anh-Việt của FVDP dịch "to get someone's shirt off" (một thành ngữ trong shirt) là "chọc tức ai". Họ xây cả một số từ điển dùng phương pháp này. Đây là lý do tôi và vài người khác quyết định bỏ qua cả từ điển Đức-Việt khi nhập vào các từ điển FVDP năm ngoái.

Tôi nói đến vấn đề này tại vì tôi cũng nghĩ Wiktionary tiếng Việt là một cơ hội để sửa các lỗi, thay vì để thêm lỗi mọc lên. Mekong Bluesman, một thành viên (không phải là quản lý) được tôn trọng lắm ở Wikipedia tiếng Việt, đã cho lời khuyên: "Đừng bao giờ hy sinh chất lượng để nghĩ đến số lượng." Chúng ta có thể bắt chước Wiktionary tiếng Nga dễ dàng: từ điển của họ thực sự chỉ là giàn xây cao chung quanh một nhà không bao giờ được xây, nhưng thay vì vậy, Wiktionary tiếng Việt sử dụng các bot cho mục đích ngay thẳng và có ích. Tôi và những người khác ở đây làm việc bằng tay khi nào mà cần sự chú ý của con người, chẳng hạn khi viết bộ từ điển cho một ngôn ngữ mới.

Hiện có nhiều dự án có mục đích hơi giống mục đích của Wiktionary và Wiktionary tiếng Việt. Tôi chỉ muốn giải thích rõ ràng những lý do tôi vẫn còn đóng góp vào đây – không phải vì thích chia cộng đồng thành hai nhóm đâu! Dù sao, xin lỗi vì tôi đã giảng lâu quá! :^) Cám ơn bạn đã đóng góp vào đây nhiều, không những vậy mà cũng giới thiệu Wiktionary ở những nơi khác – cám ơn nhiều.

 – Nguyễn Xuân Minh (thảo luận, đóng góp) 07:43, ngày 1 tháng 10 năm 2007 (UTC)

Tôi đồng ý hoàn toàn, nhưng hơi ngại tiếp tục vi phạm bản quyền vì quy định bản quyền của Wikimedia hơi nghiêm ngặt. Bất cứ lúc nào, một người có thể gặp dự án này, thấy là một phần lớn của dự án có vấn đề bản quyền, và mượn cớ bản quyền để yêu cầu Wikimedia đóng cửa nó. Dĩ nhiên đây là trường hợp xấu nhất (worst-case scenario), nhưng tôi nghĩ là Wiktionary và các dự án nguồn mở tồn tại chủ yếu để không cần phải vi phạm bản quyền (hay trả bao nhiêu tiền) để sử dụng phần mềm có ích, đọc từ điển, và học hành.
Thực sự nếu tôi muốn lo đến bản quyền một cách nghiêm ngặt, thì tôi đã yêu cầu đóng cửa dự án này rồi. Tuy nhiên, tôi muốn thiết thực (realistic?) một tí bằng cách để cho số đóng góp hợp pháp từ từ – từ từ – vượt qua số mục từ FVDP.
Đối với tôi, OmegaWiki là tương lai của Wiktionary (các phiên bản nói chung). Những dự án lớn như Oxford English Dictionary đã xài SGML và XML lâu năm rồi. Tôi tiếp tục đóng góp vào Wiktionary thay vì OmegaWiki vì OmegaWiki đang tính ra cách mở rộng phần mềm và chưa "chín" (mature?). Nếu chúng ta giữ gìn Wiktionary tiếng Việt bằng cách "tiêu bản hóa" các mục từ mới, chúng ta sẽ không gặp nhiều khó khăn khi muốn nhập nội dung vào OmegaWiki hay OVDP. Tôi chỉ cần viết vài biểu thức chính quy (regular expression) dài dễ sợ cho bot thôi. :^)
 – Nguyễn Xuân Minh (thảo luận, đóng góp) 06:15, ngày 11 tháng 10 năm 2007 (UTC)

Re: Trăm hoa đua nở[sửa]

Tôi biết đến VDict và Baamboo kia, vì ngày xưa có người hay tạo ra trang đầy liên kết spam tại Wikipedia để quảng bá nó, còn tôi thường tra cứu Baamboo khi gặp một bài bị hư hỏng, chẳng hạn nhiều mục từ có vấn đề mất các nguyên âm, nhưng Baamboo hoặc đã sửa vấn đề này. Nhưng tôi chưa bao giờ gặp website mới của Baamboo... tôi nghĩ nó có triển vọng.

Xin lỗi vì tôi cứ trở lại vấn đề bản quyền. Tuy Wiktionary tiếng Việt "thuộc sở hữu cộng đồng", nó chạy trên các máy chủ Wikimedia nên phải tuân theo luật Mỹ, và luật Mỹ rất nghiêm ngặt về tài sản tri thức (intellectual property). Ngoài ra, nó chỉ là một phần của dự án Wiktionary nhìn chung, nên có nhiều lý do không thể "đóng cửa" và hợp nhất với một từ điển tiếng Việt khác. Nhất là đây không có người chủ có quyền nói "đóng cửa". Tôi chỉ là "quản lý viên" thôi, chứ không phải là người chủ – chỉ có Jimmy Wales là người sáng lập Wikipedia/Wikimedia, nhưng ông không bao giờ đụng đến Wiktionary tiếng Việt.

May là Baamboo chọn giấy phép Creative Commons Attribution-ShareAlike (CC BY-SA), vì GFDL (giấy phép của Wikimedia) hiện thích hợp với nó nửa đường: Wiktionary đã được phép chép nội dung của Baamboo. Tuy nhiên, Baamboo chưa có quyền chép nội dung từ đây vì GFDL hạn chế hơn CC BY-SA. Creative Commons và Free Software Foundation (tổ chức viết GFDL) đang cộng tác sửa đổi các giấy phép để cho GFDL thích hợp hẳn với CC BY-SA. Vì Baamboo cũng sử dụng MediaWiki, cả hai dự án có thể chia sẻ những idea, dù chưa được chia sẻ mã nguồn qua lại thoải mái.

Còn tôi nghĩ VDict có ích vì diễn đàn tích cực, nhưng mục đích chính của Wiktionary là cung cấp thông tin nguồn mở. "Nguồn mở" không chỉ có nghĩa là ai có thể bổ sung; "nguồn mở" cũng có nghĩa là ai có thể sử dụng theo cách nào, với mục đích nào, và phải giữ gìn quyền đó cho người khác, để cho không có ai được ngừng cho phép sử dụng. VDict là của một công ty for-profit và không bao giờ nói đến tình trạng bản quyền, nên Wiktionary chắc không thể cộng tác với VDict cho đến khi họ quyết định nhận nội dung nguồn mở.

Giống như bạn, tôi không muốn giữ tình trạn chia rẽ hiện có giữa các cộng đồng từ điển này. Một cách giảm nhẹ vấn đề này có thể là xin mọi người đóng góp vào đây cũng cùng lúc đóng góp vào một hai từ điển khác. Tôi dự đoán là các dự án từ điển sẽ có điểm tốt bổ sung nhau (complementary?), chẳng hạn một có diễn đàn cho những người đang học tập ngôn ngữ, một có công cụ tự động dịch văn bản ra tiếng khác, một có thông tin nâng cao về ngôn ngữ học, v.v.

Tôi đã viết một tí về OVDP tại Wiktionary:Giới thiệu và sẽ viết thêm về Baamboo và VDict; nếu có thì giờ, xin Ngọc Minh sửa lại, vì tôi vẫn khó viết trong tiếng Việt. (Tôi đã tốn gần 2 giờ để viết lời nhắn này.)

 – Nguyễn Xuân Minh (thảo luận, đóng góp) 21:37, ngày 21 tháng 10 năm 2007 (UTC)

Hmm... tôi đang đọc thêm về mâu thuẫn giữa GFDL và CC BY-SA, và có thể là hai giấy phép này đã thích hợp hẳn đối với việc xây dựng từ điển, vì Wiktionary không sử dụng những "phần bất biến, văn bản bìa trước hoặc văn bản bìa sau" của GFDL. Chỉ có điều là GFDL bắt phải cung cấp mã nguồn dùng một định dạng dễ sửa đổi, thì tôi nghĩ nếu Baamboo sao chép nội dung của Wiktionary tiếng Việt, mã wiki của những trang được sao chép sẽ được rồi.
Ngoài vấn đề bản quyền, chúng ta vẫn có điều là Wiktionary tiếng Việt không chia website từng từ điển một. Toto; dù nó trong tiếng Việt hay tiếng Anh, nó nằm trong một mục từ ở đây. Có lẽ không có dự án từ điển ngoài Wiktionary làm vậy. (Trong Wiktionary, chỉ có phiên bản tiếng Bồ Đào Nha chia từng từ điển một.)
Cám ơn bạn vẫn cố gắng đấu tranh cho sự hợp nhất của các dự án này.
 – Nguyễn Xuân Minh (thảo luận, đóng góp) 22:15, ngày 21 tháng 10 năm 2007 (UTC)

Re: tốc độ[sửa]

Có phải nó mới chậm, hay đã chậm lâu rồi? Ở nước Mỹ thì nó bình thường, trừ đôi khi các máy chủ bị trở ngại. (Các máy chủ chính của Wikimedia ở Florida, nên phải nhanh hơn ở Á Châu.) Tôi cũng cảm thấy những website Việt Nam rất chậm, có lẽ vì đường Internet nối Việt Nam với Bắc Mỹ phải qua những nước như Trung Quốc và Nhật Bản mà có nhiều người sử dụng. Trước khi Wiktionary tiếng Việt trở thành một trong những wiki lớn nhất của Wikimedia, nhóm phát triển đã dành một nhóm máy chủ tại Seoul (do Yahoo! cho mượn) để cung cấp một vài wiki lớn trong ngôn ngữ Á Châu, như là tiếng Thái, Trung Quốc, Nhật. Nếu họ vẫn sử dụng những máy chủ tại Seoul cho mục đích này, tôi sẽ xin họ cũng làm vậy cho Wiktionary tiếng Việt. – Nguyễn Xuân Minh (thảo luận, đóng góp) 20:11, ngày 29 tháng 10 năm 2007 (UTC)

Đã trả lời Cumeo89 02:43, ngày 30 tháng 10 năm 2007 (UTC)

Re: nh[sửa]

Vâng, tôi biết đến vấn đề đó. Phần nhiều nó là chữ "Như" bị... vỡ, và tôi sẽ dùng Tildebot để thay nó bằng {{like-entry}}, sau khi làm xong việc này. Những mục từ kia thì không biết có thể sửa dùng bot hay không, tại vì có rất nhiều mục từ thiếu một số nguyên âm, ngay cả trong FVDP. Hình như những dự án từ điển kia đã bắt đầu sửa nó từng tí một, nhưng tôi chưa thấy ai sửa tất cả được. – Nguyễn Xuân Minh (thảo luận, đóng góp) 17:02, ngày 6 tháng 11 năm 2007 (UTC)

Re: Dự án Từ điển Hàn lâm tiếng Việt[sửa]

Tôi vừa nhận e-mail về dự án này, và sắp gửi tiếp cho bạn câu trả lời của tôi. – Nguyễn Xuân Minh (thảo luận, đóng góp) 05:03, ngày 30 tháng 11 năm 2007 (UTC)

Re: tách chữ khỏi liên kết[sửa]

Các cụm từ như "khác nhau" có liên kết vì từ điển Việt-Pháp của FVDP có mục từ đó. Còn Wikipedia tiếng Anh hay định nghĩa những cụm từ như "compound word", làm vậy có chỗ để cung cấp thêm chi tiết về thuật ngữ đó, cũng như dịch những cụm từ một cách dễ tra cứu hơn. Chẳng hạn, nếu chỉ biết ý nghĩa của "lối" và ý nghĩa của "mệnh lệnh", thì có lẽ không hiểu "lối mệnh lệnh" thực sự là gì. (Ở đây hay sử dụng phần {{-expr-}} vì FVDP đã được format như vậy.) Vì tôi đang bận ở trường, nếu bạn có thể tập hợp lại một danh sách các cụm từ không cần mục từ, Tildebot có thể sửa các liên kết đó. – Nguyễn Xuân Minh (thảo luận, đóng góp) 02:36, ngày 19 tháng 1 năm 2008 (UTC)

Re: liên kết viết hoa[sửa]

Vâng, tôi dự định dùng Tildebot để làm việc đó. Trước tiên, tôi phải viết một regular expression để phân biệt những phần của địa danh (như Bình An) mà cần nối lại và những từ thường chỉ cần viết thường. – Nguyễn Xuân Minh (thảo luận, đóng góp) 02:39, ngày 19 tháng 1 năm 2008 (UTC)