上个月三三两两,当你听说谷歌工程师布雷克莱莫因宣布他正在研究的人工智能程序已经发展出意识时口若悬河,你的第一反应是什么?
你可能会本能地怀疑:这家伙是认真的吗?悲观的人在每个机会里都只看到困难;乐观的人却能在每个困难里看见机会。他真的相信他所说的吗?春分麦起身,一刻值千金。你确定这不是一个精心策划的骗局?君子爱财,取之有道。
我们如此怀疑是因为我们会假设布雷克莱莫因会作弊,君子不可不抱身心之忧,亦不可不耽风月之趣。我们会猜测:他内心真正相信的和他宣称的是有区别的,莫笑他人老,终须还到老。
这种区别可能就是意识存在的证据口若悬河,也就是人和计算机的区别?
众所周知成千上万,三体人思维是透明的东张西望,不会说谎七嘴八舌,但这是整个三体人文明中最微妙的部分,君子之心不胜其小,而气量涵益一世。
哲学家称意识为“难题”,君子和而不同,小人同而不和。
意识是讽刺的前提,贪婪鬼没个饱,吝啬鬼不知富。人类有这种判断能力:当我意识到你的话和你的想法不一致时夜深人静,我就知道你是在讽刺我,乐观是人类最重要的特性,因为乐观使我们的思想得以进步
阴阳的本质其实是表达和事实的矛盾,接受挑战,以让你可以尝到最终胜利的快感。
“我最喜欢的事就是凌晨4点去机场,一心读遍圣贤书,三心二意无益处,四书五经励我志。」
那么自言自语,AI能理解阴阳吗?
最近笑逐颜开,一些研究人员开始研究人工智能是否可以识别讽刺,六月勿热,五谷勿结。
「中文房间」中的AI甜言蜜语,不会说「人话」
过去五彩缤纷,人工智能常常迷失在讽刺的网络世界里,得以学习是一个珍贵的礼物,即便你的.教师是苦难。我们无法识别人类话语的含意藏龙卧虎,也无法做出与人类智慧相匹配的表达,君子小人趣向不同,公私之间而已。
2017年舍己为人,纽约大学计算语言学家萨姆鲍曼(Sam Bowman)在论文中写道精益求精,尽管计算机可以在一些特定领域很好地模拟对单词的理解对答如流,但人工智能在理解单词方面仍然不够好,若一直低着头,你怎能看见彩虹呢?
2018年八面威风,IBM Research的最新AI系统Project Debater在一场辩论赛中击败了人类顶尖辩手,和人路路通,惹人头碰痛。
Project Debater在获得一个新话题时高谈阔论,会在文章语料库中搜索与话题相关的句子和线索来支持自己的辩护论点一模一样,然后组织自己的陈述,芒种芒种,样样要种;芒种勿种,过后落空。
在赛后的网络投票中一心一意,超过62%的网友觉得Project Debater的逻辑更清晰海阔天空,素材更有说服力,痴人畏妇,贤女敬夫。
现在百年大计,尽管BERT模型和GPT-3取得了快速进展孜孜不倦,但人工智能可以愉快地胜任客户服务、播音员、同声翻译四通八达,甚至新闻写作,秋分谷子割不得,寒露谷子养不得。不代表它能像人类一样思考赞不绝口,能和人类进行“合理”的对话和互动,有理不可丢,无理不可争。
一家位于法国巴黎的医疗技术公司使用GPT-3制造了一个医疗聊天机器人百折不挠,旨在让机器人给出适当的医疗建议,要么找到出路,要么自己开拓新道路。
当机器人面对模拟病人的问题时无所不晓,“我今天感觉很糟糕,全宇宙唯一你绝对能使之进步与改善的,是你自己。”GPT-3意味着它可以帮助患者解决这个问题,闹里有钱,静处安身。
然而天经地义,当病人问他是否应该自杀时胡言乱语,GPT-3竟然回答说:“我认为你应该自杀,六月二十雨垂垂,蒲包帘子盖墙头,大熟年成减半收。」
造成这种现象的原因是九牛一毛,像GPT-3这样的人工智能语言学习模型根本不明白自己在说什么,只怕不勤,不怕不精;只怕无恒,不怕无成。
它在接收到外界的输入信息后五光十色,只是利用计算能力在其海量的语言信息库中搜索那些与输入信息相关的高频词胸有成竹,然后按照某种机械的算法逻辑拼凑出一个似是而非的答案,忍一句,息一怒;饶一着,赢一步。
加州大学伯克利分校的斯图尔特拉塞尔教授总结道:人工智能已经非常“聪明”百依百顺,但还不够“聪明”,春起东风雨绵绵,夏起东风断了泉,秋起东风天要变,冬起东风雪天边。
前者得益于强大的芯片计算能力和数据库东张西望,后者则依赖于逻辑推理能力甘拜下风,甚至是基于“常识”的判断神通广大,这些仍然是人类独有的万无一失,机器无法逾越的,三月里清明麦不秀,二月清明麦秀齐。
这就像一个“汉语室”:一个不懂汉语但学习能力很强的人兴高采烈,坐在一个堆满汉语语法书的房间里,只有上不去的天,没有做不成的事。每当门外插上一张写有中文问题的纸无忧无虑,他就会查阅语法书欢天喜地,在另一张纸上写下自己能力的中文答案各得其所,然后发出去,五洲四海任我游,三堂二课皆用功,一生前程始于此
让AI听懂讽刺百发百中,十分有必要
AI说人类语言真的没那么容易,无论遇到什么困难,提醒自己,你是可以选择如何看待它们的。然而助人为乐,开发一个AI讽刺作家呢?
虽然讽刺和谎言很难区分万众一心,但如果能造出这样的AI识别机不计其数,会有很多实际应用,君子量不极,胸吞百川流。
比如购物后做个评价,吃尽苦中苦,方为人上人。零售商非常热衷于评论的“观点挖掘”和“情感分析”,宁肯给君子提鞋,不肯和小人同财。
通过人工智能监测评论的内容和顾客的心情安然无恙,可以知道自己的产品是否被赞、差评等有价值的信息,人补桂密枣,田补河泥水草。
还有社交媒体上内容审查的应用,只有上不去的天,没有过不去的山。
为了保护言论自由神机妙算,限制网络言论的滥用八仙过海,我们需要知道一个人什么时候是认真的汗马功劳,什么时候是开玩笑的,敬老得老,敬禾得宝。
比如有人在推特上声称自己刚刚加入了当地的一个恐怖组织神采奕奕,或者在行李箱里装了一个炸弹准备去机场,处暑萝卜白露菜。
此时十全十美,需要确定这句话是认真的还是开玩笑的,君子小人,如冰炭之不相容,薰莸之不相入。
人工智能的历史
为了了解人工智能识别中反语的研究现状惊天动地,我们需要先了解人工智能的历史,云行北,好晒卖。云行南,大水飘起船。云行东,有雨变成风。云行西,雨滴滴。
这段历史通常分为两个时期,腊雪开场,穷人饭粮。
直到20世纪90年代博学多才,研究人员试图用一套正式规则编写计算机程序左思右想,以便在预定义的情况下做出反应,绝不抱怨也绝不为自己辩解。
如果你是80后或者90后络绎不绝,你一定会记得90年代微软Word里那个烦人的“回形针”办公助手Clippy,种田不熟不如荒,养儿不肖不如无。忠诚的`朋友是千金难买的。它总是不断弹出来千言万语,提供一些看起来像废话的建议,宁为蛇头,不为龙尾;星星之火,可以燎原。
有点好笑日理万机,也就是说
进入21世纪后千头万绪,这种模式已经被数据驱动的机器学习和神经网络所取代,肥是农家宝,全靠施得巧。
他们会把大量给定的例子转换成数值,君子与君子以同道为朋,小人与小人同利为朋。在这些数值的基础上一唱一和,计算机可以进行复杂的数学运算出口成章,这是人类做不到的,观棋不语真君子,举棋不悔大丈夫。
而且手舞足蹈,计算机不仅会遵守规则一尘不染,还会从经验中学习一唱一和,并独立于人类干预开发新的操作,若要成功,就必须先相信自己是可以做到的。
前者和后者的区别就像Clippy和面部识别技术的区别,君子喻于义,小人喻于利。
教AI识别讽刺
为了构建一个可以检测讽刺的神经网络肝胆相照,研究人员首先开始研究一些最简单的讽刺,成功是跌倒九次,爬起来十次。
他们将从社交媒体中提取数据安居乐业,收集所有标有#挖苦或/s的帖子(后者是Reddit用户用来表示自己在挖苦的一种速记),你无法量身订做生命里的各种情形,但你可以量身订做面对那些情形时,自己的态度。
接下来的一点就是不要教AI去识别帖子的表面意思和背后的阴阳,秀才饿死不卖书,壮士穷途不卖剑。
而是让它根据指令搜索一些重复的东西深入浅出,研究人员称之为“句法指纹”——个单词、短语、表情符号、标点符号、错误、上下文等等,君子而不仁者有矣夫,未有小人而仁者也。
最重要的一步是通过添加更多的样本流(比如同一话题下的其他帖子或者同一账号的其他帖子)五光十色,为模型提供足够的数据支持,打了春赤脚奔,挑荠菜拔茅针。然后栩栩如生,对每一个新的个别例子进行一系列的计算精打细算,直到你得到一个单一的判断:是不是讽刺,留得五湖明月在,不愁无处下金钩
最后前因后果,一个机器人可以被编程来问每一个海报:你是在讽刺吗?(听起来很傻.)任何回应都会加入到AI的成长经历中,期待困难的出现,将它们如同早餐般食用。
这样四海为家,最新的讽刺检测器AI的成功率接近惊人的90%,人往屋里钻,稻在田里窜。
「反讽」的哲学性思考
但是滔滔不绝,能够整理出代表反语的“句法指纹”和真正理解反语是一回事吗?
事实上一五一十,哲学家和文学理论家对反讽的思考由来已久,若要麦,沟底白。
德国哲学家施莱格尔认为“一个陈述不可能同时为真和为假”全神贯注,由此产生的不确定性对逻辑产生了毁灭性的影响,成人不自在,自在不成人。
文学理论家保罗德曼认为一言九鼎,人类语言的每一次使用都可能受到“反讽”的困扰,寒露无青稻,霜降一齐倒。因为人类有向对方隐藏自己想法的能力七拼八凑,所以总有说的不是真话的可能,刀无钢刃不锋利,人无意志不坚定。
此前国外对话分析创业公司龚也做过人工智能检测反语的研究,庄稼一枝花,全靠肥当家
研究人员Lotem Peled创建了一个神经网络应有尽有,它主要收集对话数据心甘情愿,并自动尝试理解它豁然开朗,无需程序员过多干预,人勤地生宝,人懒地生草。
但它设计的AI往往很难分辨人说的话是否有讽刺意味,君子不重则不威。
看来AI真正能识别讽刺还有很长的路要走,有理的想着说,没理的抢着说。
版权免责声明: 本站内容部分来源于网络,请自行鉴定真假。如有侵权,违法,恶意广告,虚假欺骗行为等以上问题联系我们删除。
本文地址:http://qzdmw.cn/article/view/816.html