西占信息门户网
西占信息门户网 > 体育 > 「现金开户送现金」苹果开发全新AI框架,让用户亲身参与数据标记自动化

「现金开户送现金」苹果开发全新AI框架,让用户亲身参与数据标记自动化

「现金开户送现金」苹果开发全新AI框架,让用户亲身参与数据标记自动化

现金开户送现金,[云搜索网(微信号:)9月24日报道

像苹果siri这样的个人助理通过自然语言命令完成任务。然而,它们的底层组件通常依赖于受监督的机器学习算法,这需要大量手动注释的训练数据。为了减少收集这些数据的时间和精力,苹果研究人员开发了一个框架,利用用户参与的信号自动创建增强的数据标签。他们在报告中表示,当使用多任务学习和外部知识库验证等策略时,带注释的数据显著提高了生产深度学习系统的准确性。

“我们相信这是第一次使用用户参与信号来帮助大规模生成序列标记任务的训练数据,并且可以应用到实际设置中,以加速新功能的部署,而手动注释数据很少,”研究人员在一篇即将发表的论文中写道。“此外,用户参与信号可以帮助我们从数字助理自己的错误中吸取教训,并确定需要改进的地方。”

研究人员使用了一系列启发式方法来识别能够表明积极或消极参与的行为。其中一些包括点击内容以进一步参与(积极响应),长时间收听歌曲(另一个积极响应),或者中断智能助理提供的内容并手动选择不同的内容(消极响应)。这些信号以“隐私保护的方式”被选择性地获取,以自动生成基本的真实注释,然后与由人工注释者提供的粗粒度标签相结合。

为了将粗粒度标签和推断出的细粒度标签结合到人工智能模型中,论文的合作者设计了一个多任务学习框架,将粗粒度和细粒度实体标签视为两个任务。此外,它们还结合了由实体及其关系组成的外部知识库验证器。假设预测“某物”被用作音乐标题,“披头士”被用作音乐艺术家,我们可以查询“披头士演奏某物”,验证器将扩展对主要标签的替代物的搜索,并将它们发送到将对预测重新排序并返回最佳替代物的组件。

研究人员使用两个独立的测试集来评估多任务模型执行的任务。他们从生产系统中随机取样,并手动标记下面的真实标签。他们说,21个模型运行中添加的260,000个训练示例与所有手动注释数据的基线相比,“一致地”降低了预测任务中的粗粒度实体错误率。此外,他们还报告说,当有相对少量的手动注释数据(5000个示例)时,添加弱监督的细粒度数据会产生更大的影响。最后,他们报告说,对于顶层模型假设通过知识库验证的任何例子,细粒度实体错误率都降低了大约50%。

在另一个实验中,团队试图确定对用户意图的更微妙的注释是否会增加系统选择正确操作的可能性。他们收集了大约5000条“播放音乐”命令,包括对多个乐队、艺术家和歌曲的引用,并通过包含其框架的系统发送出去。之后,他们要求注释者将系统返回的响应分类为“满意”或“不满意”。研究人员报告说,增强的系统导致相对任务错误率降低了24.64%。

他们将继续探索如何利用个人用户的参与来增强个性化。

“我们观察到,我们的模型改善了用户收到的最终结果,尤其是对于包含困难或异常语言模式的请求,”该论文的合著者写道。“例如,增强的系统可以正确处理诸如‘你能播放麦莉·赛勒斯新专辑中的马里布吗’和‘肯德里克·拉马尔的谦逊’等查询。此外,增强模型还可以识别用户在遇到真实语言歧义时更有可能引用的实体。例如,在由metallica演奏的第一首中,一个可以是非物理标记(意为演奏metallica的任何歌曲),或者它可以具体指名为one的metallica的歌曲。由于大多数用户在说“播放一首金属歌曲”时会听金属歌曲“一”,我们的模型将根据用户参与注释的数据来预测“一”的确切含义,从而更好地捕捉用户组的趋势和偏好

此前,一篇论文描述了苹果的人工智能开发工具欧弗顿,其模型处理了“数十亿”的查询。此外,苹果公司最近研究了用户是否更喜欢与“健谈”的人工智能助手交谈。