上周,幂律发布《司法考试挑战赛来袭!第三届“中国法研杯”司法人工智能挑战赛启动》,小ME的朋友圈炸了,收到的都是这样的评论:“这世道真是惨绝人寰,连机器人都要学司考”“想起了被法考折磨的日子,人工智能挑战法考,太刺激了吧”“劝人学法,千刀万剐,小ME你是不是觉得强迫机器人学就不会了”
大家纷纷表示,想知道人类究竟是怎么逼着机器人学法考的?而机器人到底能不能通过法考呢?
人类如何复习法考呢?
大概是听课-看书-做题-背诵,然后重复重复再重复。
机器人呢?和人类也差不多。要说不同,可能在于,人类没有机器人超大的“脑容量”,机器人没有人类超强的“脑回路”。
师傅领进门
复习法考,人类的引路人往往是老师及其讲义,机器人却不同,他的引路人叫做数据集,他所学习的资料是由2万多道司法考试客观题组成的习题集,他的老师叫做正确答案。
习题集储备有输入(题目)和正确输出(答案)相配套的训练数据,机器人在其中进行训练,从而实现在被输入某个数据(问题)时,就能够得到正确的输出(答案)。
机器人这种学习方式,术语叫做“有监督学习”,俗称就是“师傅领进门”。
修行在个人
和人类复习法考一样,只做习题集,或者只看习题解析都是不够的,还需要自行了解题目中所涉及的考试范围、知识点和法律法规。
机器人在学习习题集的同时,也需要在考试大纲、法规汇编、教科书等组成的知识库中进行自我探索。比如在习题集中他遇见了国际经济条约相关信息,就会自动调取知识库里学到的“国际经济法的渊源”等相关知识点,进行关联匹配,从而进行判断,选择出正确答案。如图所示。
而这些关联匹配,即学习不同的概念含义,以及它们和题目之间的关联关系,是机器人自己在知识库中,不断训练完成的,数据集中的题目并没有标记出知识库中哪些知识点与当前题目是相关的。
这个过程,术语叫做“无监督学习”,俗称“修行在个人”。
人类的痛苦在于记不住,机器人的痛苦在于“想不通”
不论是“师傅领进门”还是“修行在个人”,机器人所见过的每个知识点都能一字不差的记住,并且永不遗忘。
面对15门学科,多道真题,多页讲义,多万字的法考,人类的脱发速度和遗忘速度大约是成正比的。“我知道这道题,可是我就是想不起来”,这种脑袋要炸了的感觉是人类最大的痛苦。
而机器人呢,通过在知识库中的学习,他知道犯罪人和被害人,他也知道债权人和债务人,他还知道行贿人与受贿人。
但是当他们变成了:甲把乙胖揍了一顿,丙借给了丁一百万,商人X某送给了官员Y某一辆跑车后,机器人面对甲、乙,丙、丁,X、Y,只剩眼冒金星。
或者说人类一瞬间可以做出反应的常识,他需要循环往复、不断学习很多资料后才能明白。
所以说,人类没有机器人超大的“脑容量”,机器人没有人类超强的“脑回路”,一个总是记不住,一个可能“想不通”。
机器人有它的超能力,但是法考或者说人类思维也有其“鬼畜”的地方。
机器人做题如同“开卷考试”,一分钟可以做道题
投票法考最“恶心”的科目,刑诉法和宪法往往会走入决战。
刑诉法的应战题目大约是那个关于“应该”还是“可以”的选项;宪法的迎战题目可能是究竟是“三分之一”还是“二分之一”选举投票才会生效?
这类“语义匹配”型经典案例,机器人作答,就如同“开卷考试”,法条是怎么规定的,机器人就怎么“匹配”。“卷”都在人家脑袋里,过关比较容易。
同时,天下武功,唯快不破,人类的心算能力怎样也拼不过计算机的计算速度,掌握了法考技能的机器人,做道题的速度可能比你蒙一道题直接选C还要快。
但,法考岂会这么容易?
你做英语阅读理解的痛苦,机器人也要体会
清华大学人工智能实验室曾分析过2万道法考真题,最终总结出机器人所需要的5种能力,分别是语义匹配、概念理解、数值分析、多段阅读和多级推理。
小ME看到这篇论文,想起的只有被英语阅读理解支配的恐惧,大概就是“每个词我查字典都可以认识,但是他们组合在一起我就不知道是什么意思了”。
而机器人去理解法考题目,极难有常识并进行推理。
比如“甲、乙、丙共同故意伤害丁,丁死亡。经查明,甲、乙都使用铁棒,丙未使用任何凶器;尸体上除一处致命伤外,再无其他伤害;可以肯定致命伤不是丙造成的,但不能确定是甲造成还是乙造成的”。
人类读罢案例,立即知道丁是被害人,铁棒是凶器,致命伤涉嫌故意伤害罪。
机器人呢?他要在知识库里,见过很多案例,才能理解“伤害”这个动词后面跟着的“丁”可能是“被害人”;还需要见多很多铁棒“打人”或“杀人”的案例后,才能对铁棒的概念进行理解,将它和凶器关联起来;同理,他也要见过很多很多的案例才能“猜”到“致命伤”是故意伤害罪。
更不要说,“高空坠狗案”、“粪坑防卫案”、“停尸间灵异事件”等经典习题,机器人理解概念已经够痛苦了,还要对脑洞大开进行逻辑推理,机器人到此可能想“自杀”。
新法必考的魔咒,机器人逃脱比人难的多
民法典(草案)即将提请全国人大审议,而这个事件,最可怕的并不是7编+附则、84章、个条文,总字数逾10万的庞然大物;而是现行的物权法、合同法、婚姻法在内的9部法律将同时废止。
新法和旧法之间的盘根错节,加上法考出题老师的奥斯卡级别编剧能力和挖掘机一般的刨坑能力,机器人比你更招架不住。
有人提议,直接把旧法从机器人脑袋里摘除不就好了吗?嗯,这种做法实在太过无情,而且也小看了出题老师,以及“法律的内在逻辑”。
所以,机器人他真的通不过司法考试吗?
机器人通过司考,目前看来,难度确实很大。
据幂律智能与清华大学自然语言处理实验室联合研究的成果显示,目前机器人单选题+不定项选题,答题的正确率大概是47%,差不多就相当于一个不怎么复习,但具有朴素法感情的普通考生水平。
不过值得欣慰的是,机器人做题比人类瞎蒙还是强很多。毕竟,据概率推算,人类在未开挂的状态下,瞎蒙正确率,单选题是25%,多选题是7%。
所以大家是不是松了一口气,机器人想战胜法考,没那么简单。
但是,也有可能,机器人学法律,还可以找到更适合他的方向。
法考考题脑洞大,合同却要“规矩”的多。
其相对统一的条款分类、格式规范以及书写要求,有助于机器人理清思路;而其较高的文本质量和统一性,也为机器人打开了法律应用的大门。
全科目都能教的法考老师难寻,但为机器人搭建一个合同专属教师团队却可行,也能把机器人“教”到真正帮人解决问题的程度。
在幂律智能,我们搭建了具有丰富审查实务经验和优秀理论研究经验的合同研究团队,将实务与理论相结合,梳理出合同的“脑回路”——知识图谱,并自主研发数据标注平台,构建了海量法律标注数据,为机器人提供专属“教材”;人工智能专家又将这些“教材”化为“算法模型”,而后机器人就可以在自律和他律中反复磨炼,不断精进,并可直接帮人在合同审查、合同分析及管理等真实场景中降本增效。
经过两百余天的筹备,幂律智能研发的MeCheck智能合同审查产品已经上线内测版,并即将推出正式版。
目前已启动第一批“MeCheck体验官”招募计划,希望邀请更多有想法、有热情、有活力的法律人,参与到法律AI新玩法的探索中。
进入