当前位置:

OFweek人工智能网

模式识别

正文

人工智能研究美国会议案通过率

导读: 未来,美国的国会议员们写了一个议案,没准还会先让人工智能算法打个分。一家美国人工智能公司Skopos近日在《PLOS ONE》期刊上发表论文:输入一份议案原文,外加几个变量,人工智能就能给出该议案通过立法的概率。

未来,美国的国会议员们写了一个议案,没准还会先让人工智能算法打个分。一家美国人工智能公司Skopos近日在《PLOS ONE》期刊上发表论文:输入一份议案原文,外加几个变量,人工智能就能给出该议案通过立法的概率。

根据流程规定,一份议案首先要通过参议院或众议院某个委员会的审议,经该院投票通过,再由两院投票表决。此前,有些研究者也尝试过用算法预测议案在委员会、或在两院之一通过的概率,效果参差不齐。Skopos的联合创始人John Nay目标不限于此:他想要得出一份国会议案通过两院表决、成为法律的概率。

那些想要废除奥巴马医改的议案,算法打了多少分?

Nay收集了从第103届国会到第113届国会(也就是1993年至2015年)的所有立法数据,包括所有议案的全文和其他一些因素,比如共同发起者的人数、议案发起的月份、提起者是否为该院多数党成员等。

Nay使用从第103届国会到第106届国会的数据进行机器学习。所谓机器学习,就是给算法输入大量数据,并给定这些输入值相匹配的输出值,由算法自己“摸索”出输入值和输出值之间隐藏关联的特征。他用经过训练的算法对第107届国会的案例进行了预测。

下一步,Nay又进一步用第103届到第107届国会的数据训练算法,用于预测第108届国会的案例,以此类推。

Nay最终得到的完整版算法包含以下几个部分。首先,算法需要对议案的语言进行分析。通过词汇与周围词汇的嵌入方式,算法得以解读这些词汇的含义。比如,得到“获得教育贷款”这个短语,算法会假定“贷款”这个词和“获得”、“教育”都是相关的,把所有词汇相互之间的关联以量化的形式归纳,由此,每一个词汇就可以用一串数字来代表。结合这些数字,算法就可以理解每个句子的意思。

其次,一个算法试图找到它理解的句子“意思”和议案成功率之间的联系,另三个算法寻找上下文和议案成功率之间的联系。

最后,一个伞形算法综合上述四个算法的结果,预测议案的成功率。

仅仅预测一个议案能否成功没什么价值。大约有96%的议案会失败,也就是说,你每次都猜议案都不通过,也错不到哪里去。因此,更重要的是预测到一个精确的概率值。毕竟,一个国会议案往往会涉及很大的利益,在这种情况下,把议案的成功率上升几个百分点,也是意义重大的。

Nay在论文中提到,他的算法在评估成功率时的表现,比仅仅评估议案能否成功要好上65%。

在国会的案头,想要废除奥巴马医改的议案曾一度堆积如山。这些议案在算法那里拿了多少分呢?虽然,按照平均估计,它们的成功率也只有4%,但算法无情地给所有这些议案打出了更低的概率。

措辞很重要

那么,算法在评估议案成功率时,最重视哪些因素呢?Nay意外地发现,其实议案的文本本身就起到很大的影响。议案发起人属于多数党,以及议案发起人历任多届国会议员固然是个加分项,但对议案成功率的影响不到1%。

而就文本而言,“影响”、“后果”这样的词汇能提升与气候相关的法案的成功率,而“全球”、“变暖”这些词汇只会起到反作用。在与医疗相关的议案中,“公共医疗补助”、“再保险”这样的词并不讨两院议员的欢心。在与专利相关的议案中,看起来众议院讨厌“软件”这个词,而参议院讨厌“计算”这个词。

Nay对此感到惊讶:“我之前以为立法过程主要受党派的影响,政策本身反而不怎么相关。”

这种新鲜的文本分析方法,也让许多政治学家感到眼前一亮。华盛顿大学的John Wilkerson就认为这项研究很有新意,充满前景。

声明: 本文由入驻OFweek公众平台的作者撰写,观点仅代表作者本人,不代表OFweek立场。如有侵权或其他问题,请联系举报。

我来说两句

(共0条评论,0人参与)

请输入评论

请输入评论/评论长度6~500个字

您提交的评论过于频繁,请输入验证码继续

暂无评论

暂无评论

文章纠错
x
*文字标题:
*纠错内容:
联系邮箱:
*验 证 码:

粤公网安备 44030502002758号