Bước tới nội dung

Mô đun:cjy-pron

Từ điển mở Wiktionary
local export = {}

local gsub = mw.ustring.gsub
local sub = mw.ustring.sub
local len = mw.ustring.len
local match = mw.ustring.match

local initialConv = {
	["b"] = "p", ["p"] = "pʰx", ["m"] = "m", ["f"] = "f", ["v"] = "v",
	["d"] = "t", ["t"] = "tʰx", ["n"] = "n", ["l"] = "l", 
	["z"] = "t͡s", ["c"] = "t͡sʰ", ["s"] = "s", ["r"] = "ʐ",
	["j"] = "t͡ɕ", ["q"] = "t͡ɕʰ", ["x"] = "ɕ",
	["g"] = "k", ["k"] = "kʰx", ["gh"] = "ɣ", ["ng"] = "ŋ",
	["h"] = "x", [""] = ""
}

local finalConv = {
	["r"] = "z̩",
	["i"] = "i",
	["u"] = "u", 
	["y"] = "y", 
	["er"] = "əɻ", 
	["a"] = "a", ["ia"] = "ia", ["ua"] = "ua", 
	["e"] = "ɤ", ["ue"] = "uɤ", 
	["ie"] = "ie", ["ye"] = "ye", 
	["ai"] = "ai", ["uai"] = "uai", 
	["ei"] = "ei", ["ui"] = "uei", 
	["au"] = "au", ["iau"] = "iau", 
	["ou"] = "əu", ["iou"] = "iəu", 
	["an"] = "æ̃", ["uan"] = "uæ̃",
	["on"] = "ɒ̃", ["ion"] = "iɒ̃", ["uon"] = "uɒ̃",
	["ang"] = "aŋ", ["iang"] = "iaŋ", ["uang"] = "uaŋ", 
	["eng"] = "ə̃ŋ", 
	["ing"] = "ĩŋ", 
	["ung"] = "ũŋ", 
	["yng"] = "ỹŋ", 
	["ah"] = "aʔ", ["iah"] = "iaʔ", ["uah"] = "uaʔ", 
	["eh"] = "əʔ", ["ieh"] = "iəʔ", ["ueh"] = "uəʔ", ["yeh"] = "yəʔ",
	["rr"] = "z̩ɻ",
	["ir"] = "iɻ",
	["ur"] = "uɻ",
	["yr"] = "yɻ",
	["ar"] = "ɑɻ", ["iar"] = "iɑɻ", ["uar"] = "uɑɻ", 
	["e'r"] = "ɤɻ", ["uer"] = "uɤɻ", 
	["ier"] = "ieɻ", ["yer"] = "yeɻ", 
	["air"] = "ɐɻ", ["uair"] = "uɐɻ", 
	["eir"] = "əɻ", ["uir"] = "uəɻ", 
	["aur"] = "ɒoɻ", ["iaur"] = "iɒoɻ", 
	["our"] = "əuɻ", ["iour"] = "iəuɻ", 
	["anr"] = "æ̃ɻ", ["uanr"] = "uæ̃ɻ",
	["onr"] = "ɒ̃ɻ", ["ionr"] = "iɒ̃ɻ", ["uonr"] = "uɒ̃ɻ",
	["engr"] = "ʌ̃ɻ", 
	["ingr"] = "ĩɻ", 
	["ungr"] = "ũɻ", 
	["yngr"] = "ỹɻ", 
	["ahr"] = "ɐɻ", ["iahr"] = "iɐɻ", ["uahr"] = "uɐɻ", 
	["ehr"] = "əɻ", ["iehr"] = "ieɻ", ["uehr"] = "uəɻ", ["yehr"] = "yeɻ",
}

local toneConv = {
	[1] = "¹¹", [2] = "⁵³", [3] = "⁴⁵", [4] = "²", [5] = "⁵⁴", [6] = "¹", ["-"] = "⁻"
}

local toneSandhi = {
	["2+2"] = "2-1", ["2+5"] = "2-1",
	["4+1"] = "4-5", ["4+4"] = "4-5",
	["4+2"] = "4-3", ["4+5"] = "4-3",
	["5+2"] = "5-4", ["5+3"] = "5-4",
}

local neutral = {
	["⁴⁵"] = "⁴", ["²"] = "³", ["¹¹"] = "²"
}

function export.ipa(text, feature)
	if type(text) == "table" then
		text = text.args[1]
	end
	local syllables, initial, final, tone, ipa, result = {}, {}, {}, {}, {}, {}
	local words = mw.text.split(text, "/")
	for _, word in ipairs(words) do
		syllables = mw.text.split(word, " ")
		for index, syllable in ipairs(syllables) do
			initial[index] = match(syllable, "^[bpmfvdtnlzcsrjqxgkh]?[hg]?")
			final[index] = match(sub(syllable, len(initial[index]) + 1, -1), "^[^1-6\-]*")
			tone[index] = match(syllable, "[1-5\-]+$") or (index ~= 1 and "6" or "")
		end
		for index = 1, #syllables do
			initial[index] = initialConv[initial[index]] or error(("Unrecognised initial: \"%s\""):format(initial[index]))
			final[index] = (match(initial[index], "[sz]") and final[index] == "i") and "r" or final[index]
			final[index] = finalConv[final[index]] or error(("Unrecognised final: \"%s\""):format(final[index]))
			tone[index] = tone[index] == "6" and neutral[tone[index-1]] or tone[index]
			tone[index] = feature ~= "no_sandhi" and toneSandhi[tone[index].."+"..(tone[index+1] or "")] or tone[index]
			tone[index] = gsub(tone[index], ".", toneConv)
			ipa[index] = initial[index] .. final[index] .. tone[index]
		end
		table.insert(result, table.concat(ipa, " "))
	end
	return table.concat(result, "/, /")
end

function export.rom(text)
	text = gsub(text, "/", " / ")
	text = gsub(text, '([1-9\-]+)', '<sup>%1</sup>')
	return text
end

return export