机器人怎么更懂人类?谷歌:看这五万多个视频!
【网易智能讯 10月26日消息】机器人正在看着我们,谷歌在YouTube上发布了一组视频,帮助机器了解人类如何在这个世界上生存。
“原子视觉动作”(AVA)是人们从事日常活动的三秒钟视频,比如喝水、拍照、演奏乐器、拥抱、站立或烹饪等。每段视频都标明了人工智能应该关注的人,以及他们的姿势描述,还有他们是否与某个物体或其他人进行互动。
谷歌最近在一篇博客文章中描述了这个新的数据集,称:“尽管过去几年在图像分类和寻找物体方面取得了令人激动的突破,但认识人类行为仍然是一个巨大的挑战。这是因为,从本质上讲,动作比视频中的物体更不明确。”
57600个视频片段只强调了80个动作,但却需要给超过96000人贴上标签。谷歌从流行电影中截取部分片段,强调它们来自“不同的流派和国家”。如果一段视频中有两个人,每个人都被分别标记,这样机器就可以知道,两个人需要互相握手,或者有时人们在拥抱时接吻。
这项技术将帮助谷歌分析多年的视频,还能帮助广告商更好地瞄准消费者,因为他们更有可能观看视频。一篇附带的研究论文称,谷歌的最终目标是教计算机社交视觉智能,即“理解人类在做什么,下一步该做什么,以及他们想要达到什么目标。”
您可能也感兴趣:
官方微博/微信
每日头条、业界资讯、热点资讯、八卦爆料,全天跟踪微博播报。各种爆料、内幕、花边、资讯一网打尽。百万互联网粉丝互动参与,TechWeb官方微博期待您的关注。
想在手机上看科技资讯和科技八卦吗?
想第一时间看独家爆料和深度报道吗?
请关注TechWeb官方微信公众帐号:
1.用手机扫左侧二维码;
2.在添加朋友里,搜索关注TechWeb。
为您推荐
雷军:小米SU7定价时最纠结的是盈亏点
最终悬念,小米SU7卖多少钱合适?
恒大汽车 2023 年净亏损 119.95 亿元,努力改善经营状况
日赚0.82亿 比亚迪2023年净利润300.41亿元,同比大涨80.72%
苹果WWDC 2024将于6月10日举行,或将推出生成式AI技术
苹果A18 Pro芯片细节曝光:采用更大尺寸 以提升AI性能
阿里撤回菜鸟上市申请 拟37.5亿美元收购菜鸟少数股东股权
AI造富能力一流
飞书开启裁员 全员信称会提供补偿方案或转岗机会
更多
- 投行分析师预计特斯拉Q1交付42.5万辆到47.5万辆电动汽车
- 消息称苹果可折叠屏iPhone遇到技术挑战 将推迟到2027年一季度发布
- 苹果新一代iPad Pro和iPad Air下月或无望 消息称要到5月初
- 全球生成式人工智能领域去年或有近700笔投资交易 总额291亿美元
- 华尔街预计特斯拉Q1交付47.1万辆电动汽车 但也有分析师预计低于43万辆
- 苹果WWDC24还有望推出Mac Studio 但Mac Pro可能要下半年
- 亚马逊再向AI初创公司Anthropic投资27.5亿美元 兑现40亿美元投资承诺
- 消息称苹果在测试一款新Apple Pencil 有望用于Vision Pro
- 现代汽车计划到2030年将电动汽车增至31款 韩国年产能增至151万辆
- 消息称苹果没有在iOS 18等新一代系统中引入自研AI聊天机器人计划