【更新】对不起大家qwq之前的正则表达式提取汉字和删人名的部分有点问题!!!现在已经修复过来了!!!口语语料库总有效字数10***62字!中国人说的“是”字最多。
不是“的”也不是“了”。
“的”仅仅排第三,“了”字甚至没有进前十。
这个问题不能直接照搬现有的字频数据啦。
既然题主问的是“中国人 说哪个字最多”,那么我们不能统计书面语语料,必须统计口语语料,甚至使用聊天记录都会有一定的偏差,因为我们打下的字不一定…。
顺德。 说是美食之都,广东第一,结果一堆网红店。 后面也问...
我刚到河南上学的时候,本地学生很多都是讲河南话。 一个玩的很...
很罕见,真的非常罕见, 罕见的不是你的技术,也不是你的线条,...
Rust对C++的威胁不威胁先放在一边,rustdoc文档功...
5.31: 最近突然多了很多关注,但我只是把这里当作树洞,偶...
狗儿这个小表情乐死我了! 听到蓝玉说,非要跟着郑平安回长安。...