大讨论作品之《成语接龙》

为了督促自己不停下学习的脚步，我决定尽可能每天来这里更新自己在编程方面学习和研究的成果，只要平时闲暇之余有所感触，我都会发到这里，大家一起勉励。

首先是上周在QQ群里和大家提到了制作“成语接龙”游戏的话题，在聊起这个话题之后，很多朋友给出了响应，并纷纷制作出了自己的项目，在这里首先感谢大家的支持。

这里稍稍总结一下。

游戏的规则我想我们大家都是了解的，无非就是在说出一个成语为前提的情况下，第一个字要和上一个人的答案中最后一个字相同，或同音同字，或同音不同字，或同字不同音。一开始，大家主要以制作同音同字这种情况为主，遇到的问题瓶颈在于，结尾的字太多了，相当于要把所有汉字开头的成语全部罗列出来，这将带来一个庞大的数据集合（列表），在Scratch群中，大家借助了列表的文本导入功能，成功将这个问题进行了变相的解决，之后按照读音，对文字进行分类，每个音一个列表，进而实现了同音不同字的解决方案。而对于最后一个同字不同音的部分，虽然可行，但奈何要从庞大的列表数据中筛选这些内容确实效率不高，所以最终没有特别的去实现它。

在Python群中，讨论的方向则在一开始就有了分歧，一部分学员依靠数据本地化，采用了类似Scratch中把成语存储在本地数据中的方法，建立了一个庞大的库文件（-_-||），另一部分学员则准备使用网络爬虫功能实现网络数据的采集，让网络作为程序天然的数据库存在，最终的事实证明这样的方案也确实优秀。

我们找到了一个网站，这个网站使用拼音作为页面，页面中列出了该读音下所有成语，这样问题转化为两个：1、将上一条成语的末尾文字的拼音找出来；2、从对应的成语列表页面内搜集所有的成语，并随机取出一个。

第1个问题，我们直接发现就在这个网站里，支持对每个文字进行Unicode检索，检索结果中恰好就有该文字的拼音，而且是所有读音，于是这个问题又分解成了两个新的问题：1、将该文字转换为Unicode；2、从文字检索结果页面中搜集所有的读音，并随机取出一个。

现在问题成了三个，但三个问题的难度对于爬虫知识来说，都不算难，其中页面数据搜集部分涉及到了正则表达式知识。这些问题多多少少都给大家带来了一些问题，绝大部分使用爬虫来做的学员只能使用比较繁琐的字符串处理方法，在获取的页面内容中搜集结果，正则表达式部分由于没有接触过，都不太明白该如何下手。最后在大家一起讨论+学习的氛围下，我们成功完成了正则表达式的匹配，也成功搜集到了我们要搜集的内容，并最终实现了在线版的“成语接龙”游戏。

之后我又在基础上，实现了判断回答的词组是否为成语等等。

然后，我通过玩这个游戏，认识了好多从来没听过的成语……