小米科技携手网易易盾共同构筑“小爱同学”的知识库
网易易盾以更创新的人机协作方式,为小米“小爱同学”问答语料提供了一站式内容安全解决方案,在过滤不良有害内容的基础上,挑选出优质科普问答,助力小爱同学用睿智征服用户。
借助于API动态赋能,小米的问答语料审核效率成功提升5倍,凭借更少的投入创造更多效益,成功节省大量人力成本,从而释放新的价值。
01生活中的AI助理
“我在。”设备里飘出一种亲切爽朗的声音。
诞生于2017年的"小爱同学"是基于人工智能技术打造的有趣灵魂,它出现在音响、手机、电视、手表中,其形貌与动漫中科技感十足的机甲战士一模一样,红发蓝眼,随时等待主人的指令,宛如一位“真人”生活助理。
用户只要喊出“小爱同学",就能唤醒它,需要做什么事,也只管吩咐“小爱同学”。除了与主人进行实时语言对话,“小爱同学”还能控制智能家居设备,翻译多国语言,扫描识别各类信息,并拥有解答主人问题的本领。
截止2020年6月30日,搭载“小爱同学”的设备累计激活数量已经超过2.28亿台,“小爱同学”被唤醒次数已经超过617亿次,它的月活跃用户数已经超过7840万,其魅力可见一斑。
02小爱同学的安全训练
面对用户无穷的好奇心,小爱同学持续进化,连"世界之最"、"十万个为什么"中的不少冷门知识也能不假思索地回答。在知识问答环节,小爱同学上知天文、下知地理,自然人文、物理科学。你能想到的问题,小爱同学都能接。
让“小爱同学”更好地完成问答,需要利用大量高质量的场景问答(Q&A)作为语料进行训练。工程师们为“小爱同学”网罗了来自网络的丰富问答语料文本。通过APP中的“小爱训练计划”,用户也能参与“小爱同学”的教育与培养。
梳理问答语料是“小爱同学”训练前的重中之重。在这一过程中,小米不仅要平衡量、速度与精准度,还需要应对变化带来的挑战。
首先,随着“小爱同学”快速聚集人气,摆在小米面前的是庞大的问答语料库,光是上述内容就达到千万量级,依靠传统人工审核方式来排除不良有害内容,对知识进行事实核准,不仅是因为人力成本问题,而且工作量巨大,无法快速回应“小米同学”强烈的求知欲。
一直以来,小米的自有审核团队使用内部审核后台进行审核,假设单人每日审核上千条,必须预留较长时间以消化千万量级的问答语料。由于问答语料更新速度远快于审核速度,导致了历史数据的存留。
与此同时,不良有害内容跟随时事热点发生变形。最近发生了哪些重大舆情事件?如何迎接动态的内容安全挑战?如何及时适应政府监管政策的更新?
基于这些疑问,小米深知内容安全风险无法一劳永逸地避免,只能动态管理,为用户创造一种安全、可靠的问答体验。
入选知识库的问答语料将会成为“小爱同学”的观点,且做知识科普之用,必须不偏不倚、全面客观。问答语料的审核不只局限于避免“犯错”,更在于让小爱同学身藏“智慧”,用睿智的解答留住用户。
03人机融合开启内容审核的新纪元
成功收集问答语料之后,小米即刻行动,计划寻求一套标准化的数字内容风控机制,要求高效审核、应变即时、成本可控、排除问答语料中的色情、低俗、广告、涉政、暴恐、谩骂、灌水等不良有害内容,挑选出优质科普问答,并对通过的内容标注标识。
为了达成这一目标,网易易盾为小米提供了人机协作的一站式内容安全解决方案,人工审核团队对机审后的问答语料文本进行二次标注与质量检测在过滤不良有害内容的同时,挑选出优质科普问答,推动审核效率提升5倍,节省大量人力成本。
AI机器审核,辅助审核员工作
借助于易盾的智能机器审核系统,小米成功让机器替代一部分审核工作,自动化将问答语料文本按违规类型进行标红与分类的预处理,让不良有害内容自动现行。智能机器审核系统,基于深度学习及大规模样本训练,对文本进行语义分析,包括色情、低俗、广告、涉政、暴恐、谩骂、灌水等大类。
易盾定期对模型进行优化迭代,通过收集误漏判样本,重新训练模型。平均每个模型1到2个月更新一次。融合敏感词库、文本语义分析模型、垃圾内容特征库、舆论监控、最新监管政策跟踪、前端的排查等多个管理环节,一套机制下来,计算机既能“察言”,又能“观意”,让机器学习现有变形词案例,进而总结规律,举一反三。
专业人审团队,满足特殊审核需求
一条条问答语料文本经过机器审核后,交由人工审核团队进行二次标记,在机器无法进行决策时进行干预,并纠正决策,进一步满足小米对问答语料的定制化审核需求:
○特殊策略:小米提出了甄别涉政内容的正负面与法律法规合规的需求。以《广告法》合规为例,易盾助力小米遵守相关法规要求,在有关医疗、保健、养生的知识问答中,剔除带有“推荐”嫌疑的问答。
○所见即所得:通过“问答组合过检”机制,人工审核团队助力小米排除答非所问、缺乏依据的低质科普语料,让“小爱同学”的科普更客观真实、更“人性化”。
○质检管理:为了进一步查漏补缺,小米团队在易盾自研的“审核平台”按比例设置“内容抽检”,排查人机审核后的每一条问题数据,及时纠正误判,反哺人工审核标准。
在人机协作机制大规模部署过程中,易盾持续在人员培训和技能提升项目上的投入,搭建了一支经验丰富的审核团队,紧跟舆情热点,为业务线提供更多切实可行的建议。
易盾审核平台,高度协作的审核流程
在合作中,小米通过API接入易盾“审核平台”系统,得以多线处理海量数字内容,动态开展审核数据查询、质检任务下发等操作,借力系统实时获取对审核效果的全面洞察。
相比于采用传统的审核平台,“易盾审核平台”致力于为AI和审核员分配任务,在实操中不断与客户需求进行磨合,设计了过去难以实现的审核交互操作。例如,“自动跳审”、“高量词工具”、“键盘快捷键”、“全屏审核”、“多人审核”等交互设计,助力审核员摆脱繁复的操作,成功提升人效。
04使用效果
虽只历时数月,人机通力合作将堆积的历史数据陆续消化。在全新的人机协作方案下,问答语料过审核的平均准确率在99.8%以上,审核员单人每日的文本审核量预计超过5000条,是全量人审的5倍多。
您可能也感兴趣:
官方微博/微信
每日头条、业界资讯、热点资讯、八卦爆料,全天跟踪微博播报。各种爆料、内幕、花边、资讯一网打尽。百万互联网粉丝互动参与,TechWeb官方微博期待您的关注。
想在手机上看科技资讯和科技八卦吗?
想第一时间看独家爆料和深度报道吗?
请关注TechWeb官方微信公众帐号:
1.用手机扫左侧二维码;
2.在添加朋友里,搜索关注TechWeb。
为您推荐
恒大汽车 2023 年净亏损 119.95 亿元,努力改善经营状况
日赚0.82亿 比亚迪2023年净利润300.41亿元,同比大涨80.72%
苹果WWDC 2024将于6月10日举行,或将推出生成式AI技术
苹果A18 Pro芯片细节曝光:采用更大尺寸 以提升AI性能
阿里撤回菜鸟上市申请 拟37.5亿美元收购菜鸟少数股东股权
AI造富能力一流
飞书开启裁员 全员信称会提供补偿方案或转岗机会
消息称小红书2023年首次实现盈利 但IPO前景仍不明朗
更多
- 小米再向前:小米SU7正式发布、引领汽车“智能化”下半场,「人车家全生态」全面开启
- 扬帆起航!小鹏汽车宣布正式进入德国市场
- Google 2023年移除超55亿条不良广告 9成由AI发现
- 中国移动全球首发5G-A商用部署 首批百城 年内扩至300+城
- 紫光同创推出Logos系列高性价比车规级FPGA芯片
- AI驱动营销创新Taboola Agency Award 2023名单公布
- IAR率先支持瑞萨首款通用32位RISC-V MCU
- 小米汽车上市发布会今晚7点召开 雷军确认小米SU7标准版CLTC工况续航700公里
- 最终悬念,小米SU7卖多少钱合适?
- Keep发布全新8.0版本 将投入AI资源提升运动课程生产
更多
- 全球生成式人工智能领域去年或有近700笔投资交易 总额291亿美元
- 华尔街预计特斯拉Q1交付47.1万辆电动汽车 但也有分析师预计低于43万辆
- 苹果WWDC24还有望推出Mac Studio 但Mac Pro可能要下半年
- 亚马逊再向AI初创公司Anthropic投资27.5亿美元 兑现40亿美元投资承诺
- 消息称苹果在测试一款新Apple Pencil 有望用于Vision Pro
- 现代汽车计划到2030年将电动汽车增至31款 韩国年产能增至151万辆
- 消息称苹果没有在iOS 18等新一代系统中引入自研AI聊天机器人计划
- 被美国司法部起诉垄断后 苹果在美国又面临至少3起集体反垄断诉讼
- 航拍显示特斯拉上海储能工厂准备动工 厂区内已有施工设备
- 消息称苹果不会在今晚宣布新iPad Air和iPad Pro 还得再等等