Rana El Kaliouby教授计算机阅读我们的情绪

Rana El Kaliouby教授计算机阅读我们的情绪

阅读我们的完整成绩单 科学焦点播客 采访Rana El Kaliouby关于制作机器情绪智能 - 收听页面底部的完整集。

艾米Barrett.: 所以女孩解码的是今年早些时候发表的企业业务。你能告诉我,你的书是什么?

广告

Rana El Kaliouby: 所以我的书是一个回忆录。这是我个人旅程的并置与我的旅程建设进入技术的情绪。

AB: 是什么让你实际上想要开始写作?

rek: 所以最初的想法是谈论情感A.I.或人为情绪智力和挑逗的技术的不同应用和建筑技术的道德和道德含义。但很早就,我记得和出版商企鹅,随机房子和编辑有关的会晤,你知道,你的故事真的很迷人。

我在中东长大,通过实际上在英国学习来到美国的方式。他说,那是故事,你必须交织你的个人故事。所以它最终成为这一点,再次,我的个人背景的丛生织造的混合,以及我如何从我称之为“一个好埃及女孩”到科技公司的首席执行官。以及技术的故事。

AB: 你说你今天面对你今天在哪里的最大挑战是什么?

rek: 我认为最大的挑战是我总是做一些......我是一个不合适的。正确的。喜欢,我在中东长大,但我真的想成为一名计算机科学家。我离开家做我的博士学位,当时是一个非常不寻常的,因为我的丈夫当时不得不回到开罗工作。

然后我来到美国,思考我是一个学术。但随后很快就决定成为企业家。所以我认为这只是我拍了一个非常不寻常的路径。我猜,这不是我的家人所期望的,这不是预期的社会。

所以,你知道,我是一个非常男性主导社区的科技企业家和首席执行官。所以我也不得不这样做。喜欢,我们已经提高了超过5300万美元的风险资金,但我经常投球 - 实际上几乎完全地投球 - 男性投资者。我跑了一个情感公司。正确的。所以这就像......这不是你不寻常的道路。而且我必须弄清楚如何导航。

AB: 你提到了这句话情绪。你能解释一下实际的东西吗?

rek: 是的。我经常喜欢从人类的智慧开始。因此,当我们考虑人类智慧时,您的智商,您的认知情报,当然,这是超级重要的,但您的情绪智力也同样重要。和更高的人的人倾向于 - 他们更喜欢,他们更有说服力,他们在个人,专业的生活中更好。

而且我相信这是技术的真实。你知道,技术正在成为主流。显然,A.I.正在成为主流,它正在扮演传统上由人类完成的角色,就像帮助你的医疗保健和生产力,也许驾驶你的汽车或雇用你的下一个同事。好吧,猜猜是什么?这种技术是自动化和有效和高效的,但它也必须是人以人为中心的。它必须了解人。所以我都是关于嫁给智商和欧化委员会和技术的。

AB: 智商周围有很多争议以及它如何测量和类似的东西。这是同样的eq吗?

rek: 我会说没有等等的标准措施。情绪智力的定义是一个人理解自己的能力,而且是其他人的情感和非语言信号,并且能够实时适应这些信息。

有许多测试测量eq。但是,你知道,没有什么是标准化的。老实说,我同意你的看法。喜欢,我认为难以提出一个适用于每个人的测试。

我记得当我第一次在剑桥开始博士时,我与剑桥大学的Simon Baron-Cohen教授相连。他仍然在那里运行自闭症研究中心,他把“窗户进入了眼睛”,所以同理化任务。基本上是这些只是眼睛区域的图像,你选择了像图像正在展示的情绪一样。这是一个如此的硬测试。这是迷人的。而且我试图建立一种算法来通过该测试,我还没有这样做。而且,你知道,20年,这真的很难。但人类一般都是擅长的。所以我是啊。我不知道衡量EQ的最佳方式是什么?这是一个艰难的。

AB: 但你提到那里的自闭症。什么是与eq的关系?

rek: 自闭症谱中的个人真的很难阅读其他人的非口头信号。并且实际上甚至与自己的情绪相连。当我到达剑桥时,我给了一个关于将情绪智能建立到机器的挑战的演示文稿,以及如何建立一个可以阅读人们制作的所有不同面部表情的计算机。观众中的某人说:“你知道,你必须研究自闭症”。这就是我与Simon Baron-Cohen的实验室相连的方式。

然后,然后,然后将我带到M.I.T.我想设计一种像谷歌玻璃等设备,有一点相机和频谱上的孩子可以穿它,它会给他们实时反馈,就他们与之交互的人的情绪。

因此,这是将我带到M.I.T的提案。实际上,我们最终建造了这些眼镜,现在它正在被我们的伙伴公司称为大脑权力。当他们使用这些增强眼镜时,我们看到孩子们真的很改善,它们使得更好的面部接触,它们更能读取这些非语言信号。

AB: 这种改善是否仍然没有眼镜?

rek: 这就是问题所在。这完全是这个问题。如此脑力,这家公司实际上使用了谷歌玻璃和我们的技术,他们将其部署在约400家不同的家庭。虽然我们在孩子们戴眼镜时看到了很多进步。问题是,这概括了他们什么时候把它拿出来了?它是培训工具还是假肢?和,问号。

AB: 我懂了。所以让我们回到你在谈论的实际技术,因为它可以看一下图像,脸部的运动图像。它是如何需要的,并将其转化为某人的感受?

rek: 所以我们使用一种叫做人工智能,称为机器学习或深度学习的方法。基本上,我们的想法是我们喂养算法数十万人的人微笑或微笑或皱眉的例子。并且数据越多,算法的更智能率将是。

该算法基本上寻找所有微笑之间相似的所有内容。所以也许就像你的唇角一样向上拉,你可以看到一点点牙齿和所有常见的东西,你知道,在眉毛沟里。所以它就像你眉毛之间的这些皱纹。它学会了。

所以下次它看到了一个图像或者以前从未见过的那种视频,它就能说,'哦,嘴唇向上和向外转动,我看到一点点牙齿。这一定是微笑。

而且你重复了这个,你知道,你冲洗并重复,始终提高算法的准确性,还可以改善算法可以读取的reptoIre。所以当我们第一次开始时,它只能像几个表达式一样读。它可以像微笑或皱眉一样。现在它可以阅读30多种不同的面部表情和心理和情绪状态。所以,你知道,我们继续改善它。

AB: 但这些表达,他们是否直接与情绪相关?因为有一些人的表现不对,更加表征,你是如何应对的?

rek: 这实际上是一个很大的问题,因为这些构件块或这些面部表情周围的争论很小。因此,在70年代末,保罗·埃克曼和他的团队,他们发表了面部动作编码系统,将每个面部肌肉运动映射到代码。

所以当你微笑时,它是动作单元12,这是颧骨,皱眉是动作单元4,它是鞋子肌肉等等。并成为一名经过认证的面部读者,你经历了100个小时的训练,然后你能够准确地说,好吧,我看到,动作单位一个加二加1倍。正确的。

所以这对此有很少的争议。在那里它变得有点棘手,然后将面部表达映射到底层情感状态。正确的。所以,如果我看到你向上蜷缩着你的嘴唇,你知道,那里有这些乌鸦的脚在你的眼睛周围皱起了皱纹。我可以说你很高兴吗?好吧,你微笑着,但你可能会或可能不会幸福,对。而且我认为推动层非常复杂。你必须考虑上下文。你必须了解一下这个人和他们在做什么。甚至可能会考虑时间随着时间的推移方式。也许是其他手势或声乐语调。所以我认为这实际上是一个非常复杂的问题。我们正在努力,但我不会说任何人还在破解它。

AB: 我的意思是,还有很多人仍然......就像有这么多的事情。我仍然没有总是觉得我可以准确阅读某人。你怎么去做机器这样做?人类不能。

rek: 是的。所以我们已经获得了我们的认证,我们有大约50个事实,经过认证的面部编码器,他们受过训练以注释这些视频。我们也喜欢点击自我报告。所以我们有时会要求人们在某种经历中报告他们所感受到的内容。我们用它作为地面真相。

但基本上,你知道,算法需要标记的例子,以便它知道,“好的。这就像一个红苹果,这是一个绿色的苹果“或”这是一个微笑,这是一个傻笑“。嗯是的。所以我们目前使用的方法是使用数据注释器。他们的工作是,你知道,在和日出来观看这些视频并注释四个不同的表达。

而且,您知道,我们也对认知状态感兴趣。因此,不一定是你通常认为是一种情绪,但它们非常重要,就像我们在汽车行业做了很多工作。我们对驾驶员嗜好或分心感兴趣。嗯是的。因此,如果您开始看到某种眨眼速率,或者,您知道,您的头部是Bobbing。这是一个非常独特的令人困倦的迹象。我们都知道。正确的?因此,我们正在尝试构建可以检测到该算法。

AB: 我的天啊。所以有很多现实世界的应用,但它似乎也可能存在与技术相关的危险。

rek: 是的。所以就像任何技术一样,你知道,这是中立的价值。它可以是它可以用于良好,它可能被滥用。这项技术可以......

有,你知道,有很好的潜力。您知道,在心理健康和自闭症中存在应用,检测压力和焦虑和帕金森,使我们的道路更安全。就像列表一样继续下去。

但绝对有可能滥用的应用程序。对我而言,我们认为它是情感AI的道德发展。但也是道德部署。

我现在所拥有的最大问题是意外地将偏差建设到这些算法中。正确的。与您的方式,您知道,您不小心这样做是如果您的数据偏置,则算法偏置。如果算法偏见,然后在比例下部署它,因为它是技术,您可以非常快速地部署世界各地。然后你现在在社会中存在的偏见。你已经这样做了,你乘以比例所知道的那样。

所以这是我真正担心的事情。我们尝试在我的公司影响,我们试图真正了解数据的多样性,我们如何处理这个问题以避免偏见,也是团队的多样性,因为我们每个人都有自己的盲点。是的,我不知道,就像你知道,团队更多样化,你的角度越多。我们已经看到了我们的团队的例子,你知道,人们就像,“我没有看到这个数据库中的任何人看起来像我一样”。我们就像,哦,是的,我们没有意识到。所以我认为在建立AI时,我们强调了多样性的重要性非常重要。

AB: 这是有道理的,因为我的意思是,面部识别软件着名有一些偏见,现在仍然与颜色的人一起挣扎。 KIKE,那是如何联系的,我猜你的技术必须依靠一些面部识别,是对的吗?

rek: 因此面部识别使用我们使用的相同的基础技术。所以很多电脑视觉和机器学习。差异是面部识别,你对身份识别感兴趣。我们真的不关心你是谁。我们只是想了解你的经历是什么样的。你感觉怎么样?你的经历是什么?

但是,你绝对是正确的。有很多证据表明,面部识别系统是,你知道,因为他们主要训练,你知道,中年白色家伙。它可能会或可能不会概括两个女人,如美国的两个或妇女。正确的。但是,你知道,有人喜欢,那是像我这样的棕色皮肤。正确的。所以这是一个真正的问题。

并再次,对抗这是真正的数据,只是对我们用来训练这些算法的数据来了解。

AB: 有没有办法,计算机可能成为可能的方式,即AI可能变得情绪智能,这在面孔上并不依赖?对于某人,你知道,有人知道有面部畸形。技术如何解决如此?

rek: 是的。所以崩溃,正如我们沟通的方式,我们的情绪和精神状态的方式只有10%的信号是在选择单词的选择中,90%是非语言。它几乎同样在你的面部表情,你的手势和你的声音语调之间。那你说的是多么快?你的声音有多少能量?所以这也是一个重要的信号。在这种多模态方法中,我们一直在投资这一点。所以最好的结果将是一天我们可以将所有这些信号组合在一起,就像人类一样。

我会说我的意思是,这整个领域仍然非常漂亮。所以有很多工作要做,但这就是让它令人兴奋的原因。是的。但有时候,你知道,有时脸部可用,有时它不是。有时声音可用,有时它不是。

所以你拥有的更多信息,更好。

AB: 促使你开始工作的是什么?

rek: 我会说,我的意思是,我在一家技术家庭中长大。所以我的父母都在技术上。我在开罗和中东周围长大。所以我一直很舒服。你知道,我爸爸会购买所有这些,如最新的小工具和视频游戏控制台。

实际上,我最早的回忆之一是我的父亲购买了一个非常像视频VHS相机。他会在我的蓝色椅子上座位。它真的像一把塑料蓝色椅子。我会像漫步一样。我可能就像三到四岁。我就像谈话一样。他会记录所有这些视频,我称之为,就像我在TED谈话中的第一次做法。

所以我对技术非常舒适。但是我总是......为我们,技术是关于将我们的家人带到一起。因此,它更加关于人类连接而不是实际技术。我会说这是我职业生涯中的一个共同的线程。

但是,真正的'啊哈!当我从英国从开罗到坎布里奇的时刻来了,因为我的博士学位,并意识到我在笔记本电脑前花了更多的时间,而不是我与任何其他人的互动。我意识到,哇,这台电脑绝对没有Clue我的感受。甚至更糟糕的是,它是最多的,它是我对家人回家的事实上的沟通方式。但所有这些非语言通信和所有这些都像丰富的信号一样,有点在网络空间中丢失。我不知道。就像,它创造了一个连接的错觉。正确的。我觉得就像我已连接。但这不是一个真正的实质性联系。是的。

所以让我在这条道路上。我开始问,就像哦,哇。哇。喜欢,如果计算机可以识别人类的情绪,那么我们的方式是什么?是的。这一事件超过了20年前。

所以我已经......这是一个漫长的旅程。

AB: 就这一人在两人之间的那种互动方面,无论是两台电脑还是两个手机,我的手机如何在情感上聪明地实际上改变我发短信的方式或者在日常时代的情况如何转向那些生活?

rek: 是的,有很多。我的意思是,如果你想到今天的社交媒体平台,那么很多是情绪盲目。喜欢,你发出所有这些,喜欢,文本评论和推文和whatnot。是的。有时你可以在最后添加一个小表情符号,以澄清你的意图是什么。但大多数时候,你也发送了这个消息,你不知道它是如何落在收件人上的。正确的?如果它有趣,如果有趣的话,你不知道是否有伤害。所以我们缺少所有的层,如果我们在一个人的对话中,你会得到。

所以我想,你知道,我认为社交媒体平台需要大修,只需要重新设计,一种以人为中心的重新设计,以考虑所有这些富裕的非语言线索。我实际上认为这将导致更多的同理心。或者我希望它会导致更多的同情危机,即我觉得我们正在经历。

AB: 但是,就是说,说,一个社交媒体网站可以知道我的感受如何,即使我自己不知道?

rek: 不,这是一个很好的谈话,因为我认为我们设计这一点是如此重要的选择这一点,而且人们对被可视化或被传达的内容进行最终控制。我认为这实际上真的很钥匙。所以我们迄今为止我们所做的一切都在加入和同意。

我认为这真的是部署这项技术的关键部分。但我会给你一个例子。所以这本书在4月21日出来了。而且,你知道,就在这个大流行中,我应该像一个实际的书籍巡回赛一样,与人们见面并呈现给人们。所以我们不得不抓住几乎所有这一切。而且它通常需要的格式是我与主持人的书籍对话,通常有数百人,有时甚至甚至在调整成千上万的人。但我看不到他们。就像我在同一个房间里和他们在一起,你会避开观众的能量。您可以个性化您的答案。你几乎不能这样做。我发现它真的很令人不安。因此,如果情绪AI被整合到这些平台,如缩放或者,您知道,所有这些其他LivestReam平台,我都会像一个实时图形或一些视觉 - 那就非常简单易于消耗 - 这就说,哦,是的,是的现在笑了,或者他们对死亡感到无聊,就像拿起一点点。

AB: 好吧,听起来很可怕。你知道,在一个大谈话中,我可以告诉一半的观众睡着了。

rek: 是的,我知道。也许,你不想这样做。当然。正确的。你不想知道。

AB: 我们实际远离这是一个现实?

rek: 所以技术在那里。我的意思是,很多人都没有意识到,我们部署在全球90个国家。我们向市场推向的第一个产品在媒体分析空间。所以我们能够再次拥有人们的同意,了解人们如何回应在线视频内容,就是它是在线视频广告,可以是电影预告片,电视节目。

我们能够匿名量化,就像我们不一样,我们不想知道你是谁,而是匿名,我们聚合每个人的回答,我们能够看到时刻,人们如何回应?他们在哪里订婚,他们冒犯了什么?他们笑了吗?而且,你知道,每天四分之一的财富500强公司每天使用这项技术来评估他们的用户和消费者对其内容的情感订阅。所以这项技术就在那里。

我们非常专注于汽车行业。因此,我们正试图将其整合到汽车以检测驾驶员安全和分心和嗜睡。

所以,我会说,几年来。但后来有很多心理健康的应用。我们甚至谈论,智能家用电器。

就像想象一下,如果你走到你的冰箱里 - 我认为我们实际上需要这一点 - 如此想象,如果你走到冰箱里,你知道,你知道,“你会有你的第三个Ben和Jerry的冰淇淋浴缸。我不会让你这样做。“它只是锁定自己。

AB: 我绝对不需要,我的意思是,我需要我的本和杰里。其他冰淇淋选项当然可以提供。

rek: Right. Right, right.

AB: 但在这段时间里,就像你知道,我们都是如此分开了人,面对面面对面。所以现在看起来是我们最需要在我们的机器中表情的时候,对吧?

rek: 绝对地。我的意思是,我觉得我一直在传送,你知道,当我觉得如此孤独和如此沉重的时候,那时候在剑桥,尽管有了技术,但仍然如此断开。我觉得我们已经被运到了我们与我们的团队联系起来的那一刻。几乎我的孩子几乎在学习。我几乎我和家人在一起。我们正在为这个人的联系方式渴望。正确的。

我们希望了解共享经验。有时候使用技术很难做到这一点,即使是我知道,即使是我的意思也是如此,我非常感谢像ZOOM和其他视频会议平台这样的平台,因为它已连接我们,但它不一样。

而且我认为出现这种大流行,我们会看到很多创新,技术,创新,你知道,将这些视频会议平台带入下一级别。所以,是的,我很高兴看到这是什么。

AB: 你提到了情感计算的术语。你能解释一下这意味着什么吗?

rek: 是的,情感计算。所以'影响'是一种情感的同义词。我的导师和联合创始人,M.I.T的Rosalind Picard教授。,她在1996年写了这本书的情感计算。我几年后读了它。在那里,她占据了计算机和技术需要能够理解和适应影响。

所以这可能再次,你的面部情绪,你的生理信号,就像你的心率或你知道,压力水平,也是你的声音和你的手势。所以她真的是那个创造这个词的人。我读了这本书,它改变了我生命的轨迹。

AB: 我们谈到了如果AI可以善意,但对于同理心来说,至少在人类中,这是我们分享情绪。我们可以识别我们的情绪和别人。这是否意味着可以能够感受自己的情绪?

rek: 我不这么认为。我不认为机器有同情的反应,他们需要有......你知道,我们是在模拟同理心,基本上。我认为这很重要。但这并不意味着,你知道,你的烤面包机,你的情绪使能的烤面包机必须具有情感。因为那么我们冒着烤面包机的风险,你知道吗?我今天正在休息一下。我很筋疲力尽。吃别的东西。

AB: 而且你被福布斯命名为美国的50名妇女技术。但是你提到它仍然是一个非常男性,非常白的男性。那种让你感觉如何?你在哪里看到行业呢?

rek: 我非常热衷于带来更多女性的技术,但不仅仅是女性,在技术方面的多样性。可能是,你知道,性别多样性,种族多样性,背景的多样性。因此,我们需要使非技术人员和年龄的多样性更能访问它。

就像我非常热衷于涉及年轻人进入整个AI对话,因为他们需要成为我们如何设计的一部分,因为他们将成为最多的人。

但随着性别多样性,我非常非常喜欢,我非常积极参与一些组织。有一个叫做所有提升,这主要是基于美国。但我们专注于为女性创始人带来更多的资金,还要创造更多的女性投资者生态系统,因为这也是我们需要的,对吧?

所以,是的,我想我们有很多工作要做。但我认为这是非常需要的。这是它是一个方面。它位于创始人社区和投资者社区,在董事会层面,管道水平,像对技术感兴趣的年轻女孩和女性。它到处都是。我们需要工作所有角度。

AB: 什么给你最希望的希望?

rek: 一般来说或关于多样性?实际上,我会开始多样性,我确实觉得这个世界就在考虑到我们意识到有这么多的系统性不公正,我们有机会真正解决这个问题。所以我很兴奋。我也觉得可能是这个全球大流行的一个银色衬里是我们都同时经历了这个。我们正在以非常不同的方式遇到它。但我希望这是重新发现和重新庆祝同理心的机会。

AB: 然后接下来是什么?你有这本书,你在写另一个吗?

rek: 还没有。虽然我不认为我在我身上有另一本书,但我有一个关于书的想法。现在是......我还没准备好开始写一本书。但我知道,我最初认为写这本书是为了,你知道,我写了这本书,发射了这本书,然后它将结束。而且我发现这本书是开始。而且我不知道开始是什么,但我很高兴能够与这本书开始这个新的旅程。它正在启动大量的谈话和与世界各地的各种各样的人。所以我非常感激。

AB: 如果有人想进去,测试你的情绪聪明的AI。他们能这样做吗?

rek: 哦是的。我们网站上有一个互动的演示,所以他们可以去www.affectiva.com并试一试,让我们让我们呀。如果你试一试,请告诉我们你的想法。并且通常这会引发人们在人们的大脑中引发了许多想法,他们希望使用的技术,我喜欢听到所有这些创造性的想法。

AB: 你个人最好的用途是什么?

rek: 我认为心理健康的最大潜力诚实。因此,事实证明,有压力,焦虑,抑郁症,甚至自杀意图,帕金森的面部和声乐生物标志物。所以我认为有很多机会使用这项技术来理解一个人的基线。然后当他们偏离它时,该技术可以向个人旗帜,临床,临床医生。很多隐私问题,但我认为那里有很多潜力。

AB: mm hmm。你发现自己的类型,方面的岁月多年来增加了吗?

rek: 我想是这样。我谈论的书中有一会儿 - 我离婚 - 我谈论我如何讽刺的方式如何为我的整个职业教学技术如何阅读情绪,但我错过了我当时的丈夫是如此不开心。

我完全,我的意思是,我们没有这个视频镜头,但我想我在他总是说话的时候听了他的话说,“哦,没关系。没关系。你去做你的博士,你开始了一家公司。“我只是想知道非言语是什么,我知道,是他,他的无更不同的地方吗?而且我不知道答案。

所以我想,是的,这种教学机器的旅程如何拥有更好的EQ已经教会我俩更好地听,并更好地观察这些非语言信号,而且,就像,喜欢我自己的情绪。我真的没有这样做的职业生涯。这只是在过去几年中,因为我开始写这本书,我意识到真正的力量就像真正的力量,都是一个人的自我,而且还容易受到别人的影响。

而且我完全接受了这本书,也在我领导公司和我的团队的方式。


这个播客得到了支持 bright.org.,帮助人们在乐趣和挑战互动探索中建立数学,科学和计算机科学的定量技能。

倾听更多的剧集 科学焦点播客:

广告