小扎亲自官宣Meta视觉大模型,自监督学习无需微调,多任务效果超OpenCLIP 环球今日报
无需文字标签,完全javascript自监督的Meta视觉大模型来了!
小扎亲自官宣,发布即收获大量关注度——
在语义分割、实例分割、深度估计和图像检索等任务中,这个名叫DINOv2的视觉大模型均取得了非常不错的效果。
(资料图片仅供参考)
甚至有超过当前最好的开源视觉模型OpenCLIP之势。
虽然此前Meta就发布过自监督学习视觉大模型DINO,不过这次AI识别图像特征的能力显然更进一步,准确分割出了视频中的主体:
可别以为DINOv2通过自监督学会的只有图片分割。事实上,它已经能根据不同类别、不同场景下的照片,准确识别出同种物体(狗)的头部、身体和四肢长在哪:
换而言之,DINOv2自己学会了找图像特征。
目前Meta官方不仅已经放出了开源代码,而且还给了网页版Demo试玩。有网友内涵:
准确识别不同画风的同种物体
事实上,DINOv2是基于上一代DINOv1打造的视觉大模型。
这个模型参数量是10亿级,也仍然是视觉Transformer架构(ViT),但与DINO不太一样的是,这次DINOv2在数据集上经过了精心挑选。
具体来说,DINOv2构建了一个数据筛选pipeline,将内容相似的图片精心筛选出来,同时排除掉相同的图片:
最终呈现给DINOv2的训练数据图片虽然没有文字标签,但这些图片的特征确实是相似的。
采用这类数据训练出来的视觉模型,效果如何?
这是DINOv2在8个视觉任务上的表现,包括语义分割、分类、深度估计等,其中橙色是自监督方法的效果,深粉色是弱监督方法的效果。
可以看见,经过自监督学习的视觉模型,表现上已经与经过弱监督学习的模型性能相当。
实际效果也不错,即便在一系列照片中,相同物体的画风并不相似,DINOv2也能准确识别它们的特征,并分到相似的列表中。
如(a)组中都具有翅膀的鸟和飞机、(b)组中的大象和大象雕塑、(c)组中的汽车和汽车玩具模型、(d)组中的马和涂鸦版马:
而且从PCA(主成分分析)图像效果来看,DINOv2不仅能准确分类,还能用不同颜色标出它们“相同”的部分,例如象鼻都是绿色、车轮都是红javascript色、马的尾巴是黄色等。
换而言之,DINOv2能理解这些图像中的相似之处,就像人会形容飞机“看起来像一只鸟”一样。
目前DINOv2已经放出Demo,我们也试了试它的实际效果。
Demo直接可玩
官网已经开放语义分割、图像检索和深度估计三大功能的试玩。
据Meta介绍,这几个任务中,DINOv2在大多数基准上超过了目前开源视觉模型中表现最好的OpenCLIP。
我们先来看看深度估计的效果。
值得一提的是,在效果更好的情况下,DINOv2运行的速度也比iBOT更快,相同硬件下只需三分之一的内存,运行速度就能比DINOv2快上2倍多。
这是Meta论文中与OpenCLIP在实际例子上的比较效果:
我们用这张猛男版新宝岛试一下,看起来还不错,即使是高糊图片也能比较好地估计出深度:
接下来是语义分割的效果,这里也先给出Meta论文中编程客栈的数据对比情况:
这里也给出OpenCLIP和DINOv2的对比,中间的图片是OpenCLIP的效果,右边是DINOv2分割的效果:
我们也用一张办公室的图片试了一下,看起来DINOv2还是能比较准确地分割人体、物体的,但在细节上会有一些噪点:
最后是图片检索。
官网上给出的图片效果还是挺不错的,输入铁塔照片,可以生成不少含铁塔的相似艺术图片:
这里我们也试了试,输入一张华强买瓜,给出来的艺术图片大多数与西瓜有关:
那么,这样的自监督视觉大模型可以用在哪里?
从Meta给出的视频来看,目前有一些比较环保的用途,例如用于估计全球各地的树木高度:
除编程客栈此之外,如同扎克伯格所说,DINOv2还能被用于改善医学成像、粮食作物生长等。当然这里小扎还进一步强调:
嗯,看来Meta的元宇宙路线还将继续……
试玩Demo地址:https://dinov2.metademolab.com/demos
项目地址:https://github.com/facebookresearch/dinov2
标签:
为您推荐
广告
- 小扎亲自官宣Meta视觉大模型,自监督学习无需微调,多任务效果超OpenCLIP 环球今日报
- 疫情期间怎么办理健康证明 疫情期间怎么办理健康证明模板 报资讯
- 北京朝阳公园·融创壹号院@售楼处|户型价格全系四居|最新消系
- 【天天新视野】长荣股份:公司会通过优化供应链管理水平,提升管理效率等手段,加强精益管理,做好成本控制
- 【财经分析】招行向员工讨回5000多万元 银行“反向讨薪”将成常态
- 全球要闻:江铃福特科技第一季度销量猛增72%,全球市场累计售出21,955台
- 港股午评:恒指跌0.75%,内险股走高中国太保涨超4%,安踏配股跌逾7%
- 为了营商环境更舒适,浙江走出舒适区 “一号改革工程”如何攻坚 全球热讯
- 远兴能源:阿拉善天然碱项目一期计划6月投料试车,产能将陆续爬坡释放|全球观点
- 寒冷的冬天 2021针织女装新款图片
- 政策聚合发力 数字经济加快成长为驱动经济增长的“新引擎”
- 物流新路子 乡村新机遇(快评)-环球速讯
- 全国专科院校排名 青海专科院校排名(最新排行榜)
- 全球最新:如何评价大众辉腾及其业绩?
- 通山县气象台发布雷电黄色预警【III级/较重】_天天报道
- 红旗新能源首辆轿车——红旗E001“谍照”抢鲜看
- 中国建筑2022年房地产业务营收2820亿 新购土储1489万平米
- 潜战危机3浴血森林_关于潜战危机3浴血森林介绍-世界速读
- 踢球者:拜仁今夏可再尝试签奥斯梅恩,但相比德甲球员更想去英超_当前关注
- 一艘载有600人的渡轮在美国华盛顿州搁浅_天天热点
广告
- 【环球播资讯】世界上最美丽的33座清真寺
- 草芽_世界热头条
- 江苏输上海4分!李楠正式回应:我们始终在进步,但不是十全十美 全球播资讯
- 世界视讯!朱泥壶如何辨别真假_朱泥壶怎么辨别真假
- 宋山东宋东|新视野
- 关爱关节 燃情亚运 健力多千人健步走活动开启,最小参与者仅2岁
- 2023武汉马拉松各公里点关门时间参考表来了⬇ 全球热头条
- 【全球播资讯】广州远洋天成值不值得买
- 返乡筑梦路正宽|当前热讯
- 绩效管理工具有哪些分别适用于哪里_绩效管理工具有哪些
- 每日热门:李兰祥:聚焦延链、补链、强链各个环节 为推动地区经济发展注入新活力
- 胡歌妻子曝光2个月后,一张照片刺痛全网:40岁后有福之人,果然是这种_热点
- 快来“种草”你喜欢的宝藏蜀乡!四川省第三届乡村文化振兴魅力竞演大赛报名通道开启 环球微速讯
- 今亮点!保利龙原材料是什么_保利龙是什么
- 证监会同意大商所乙二醇期权和苯乙烯期权注册
- 学法又答题 盘州市司法局开展4·15国家安全日系列宣传活动
- 陕西商洛商南县油坊岭村:生态茶园采茶忙-视讯
- 全球微资讯!四年级科学耳朵的结构和功能_耳朵的结构和功能
- 环球报道:东高科技高级投资顾问毕然接受《证券日报》采访:港股市场掀回购潮
- 酒吧组织未成年少女有偿陪侍 3人获刑