视觉 - 智链探索

置顶穿越数字边界：网络自由的探索

点击直达在当今数字化的世界里，网络自由是无价的，但有时也受到了地理和政治界限的限制。有一种方法，一种隐藏的方式，让我们能够穿越这些数字边界，实现网络自由。这个方法有点像背后的秘密通道，允许您访问被封锁或限制的网站，享...

2023-10-20 2.95 K 阅读 0 评论

愤怒的蜗牛

置顶掘金俄罗斯电商蓝海！Ozon——中国卖家的黄金机遇

目前俄罗斯ozon在国内正处于超级红利期，平台自然流量很大，基本能做到上架即出单的地步，ozon官方计划在2024年要招商满10万卖家入入驻，乾坤未定，你我皆是黑马！平台现在跟13年的淘宝一样正在蓄力爆发，跨境电商时...

2025-03-02 1.18 K 阅读 0 评论

愤怒的蜗牛

置顶🚀 Ozon无货源模式全攻略！低成本启动，轻松月入过万！

想进军俄罗斯电商市场，却担心门槛高、操作难？Ozon无货源模式让你0囤货、0风险、轻松赚钱！只需每天2小时，就能在俄罗斯开店！第一步：了解Ozon平台——轻松上手，0门槛副业Ozon平台支持无货源玩法，只需出一单发一...

2025-03-03 2.06 K 阅读 0 评论

愤怒的蜗牛

不让视觉语言模型「盲猜」，性能竟直接提升一倍？

团队的共同一作林之秋（Zhiqiu Lin）是卡内基梅隆大学的博士研究生，由Deva Ramanan教授指导，专注于视觉-语言大模型的自动评估与优化。团队的马紫晛（Zixian Ma）是华盛顿大学的博士研究生，由Ra...

2024-11-11 446 阅读 0 评论

愤怒的蜗牛

视觉定位新SOTA！华人团队开源革新框架SegVG，边界框转为分割信号 | ECCV 2024

视觉定位（Visual Grounding）旨在基于自由形式的自然语言文本表达定位图像中的目标物体。随着多模态推理系统的普及，如视觉问答和图像描述，视觉定位的重要性愈加凸显。已有的研究大致可以分为三类：两阶段方法、单...

2024-11-06 448 阅读 0 评论

愤怒的蜗牛

无需参数访问！CMU用大模型自动优化视觉语言提示词 | CVPR’24

视觉语言模型（如 GPT-4o、DALL-E 3）通常拥有数十亿参数，且模型权重不公开，使得传统的白盒优化方法（如反向传播）难以实施。那么，有没有更轻松的优化方法呢？就在最近，卡内基梅隆大学（CMU）的研究团队对于这...

2024-11-04 532 阅读 0 评论

愤怒的蜗牛

从数据增强的隐藏作用出发，揭示视觉强化学习可塑性损失的独特机制

Sutton 等研究人员近期在《Nature》上发表的研究《Loss of Plasticity in Deep Continual Learning》揭示了一个重要发现：在持续学习环境中，标准深度学习方法的表现竟不...

2024-09-28 482 阅读 0 评论

愤怒的蜗牛

抛弃视觉编码器，这个「原生版」多模态大模型也能媲美主流方法

一作刁海文，是大连理工大学博士生，导师是卢湖川教授。目前在北京智源人工智能研究院实习，指导老师是王鑫龙博士。他的研究兴趣是视觉与语言，大模型高效迁移，多模态大模型等。共同一作崔玉峰，毕业于北京航空航天大学，是北京智源...

2024-07-15 595 阅读 0 评论

愤怒的蜗牛

视觉Mamba来了：速度提升2.8倍，内存能省87%

本周四，来自华中科技大学、地平线、智源人工智能研究院等机构的研究者提出了 Vision Mamba（Vim）。论文地址：https://arxiv.org/pdf/2401.09417.pdf项目地址：https:/...

2024-01-20 642 阅读 0 评论

愤怒的蜗牛

计算机视觉在无人机技术中的应用

计算机视觉在无人机中有多种应用。这些用例使企业能够出于若干目的使用无人机。在过去的几年里，无人机在零售配送、摄像、房地产摄影和土地调查等各个领域越来越受欢迎。根据一项研究，商用无人机市场预计将在未来几年进一步增长。因...

2023-11-25 805 阅读 0 评论

愤怒的蜗牛

谷歌视觉语言模型PaLI-3问世，参数仅5B，更小、更快、更强

在大模型时代，视觉语言模型（VLM）的参数已经扩展到了数百甚至数千亿，使得性能持续增加。与此同时，更小规模的模型仍然很重要，它们更易于训练和服务，更加环境友好，并为模型设计提供更快的研究周期。在该领域，谷歌研究院在去...

2023-10-17 711 阅读 0 评论

愤怒的蜗牛

特斯拉 Optimus 人形机器人再进化：可依靠视觉自主分类物体，还能做瑜伽

9 月 24 日消息，今日早些时候，特斯拉 Optimus 的官方推特账号上传了一段新视频：这种人形机器人已经获得进化，现在能够仅依靠视觉来对物体进行分类，还能完成瑜伽动作了。对此，马斯克好像也难掩内心激动，在评论区...

2023-09-25 755 阅读 0 评论

愤怒的蜗牛

视觉

置顶穿越数字边界：网络自由的探索

置顶掘金俄罗斯电商蓝海！Ozon——中国卖家的黄金机遇

置顶🚀 Ozon无货源模式全攻略！低成本启动，轻松月入过万！

不让视觉语言模型「盲猜」，性能竟直接提升一倍？

视觉定位新SOTA！华人团队开源革新框架SegVG，边界框转为分割信号 | ECCV 2024

无需参数访问！CMU用大模型自动优化视觉语言提示词 | CVPR’24

从数据增强的隐藏作用出发，揭示视觉强化学习可塑性损失的独特机制

抛弃视觉编码器，这个「原生版」多模态大模型也能媲美主流方法

视觉Mamba来了：速度提升2.8倍，内存能省87%

计算机视觉在无人机技术中的应用

谷歌视觉语言模型PaLI-3问世，参数仅5B，更小、更快、更强

特斯拉 Optimus 人形机器人再进化：可依靠视觉自主分类物体，还能做瑜伽

登录/注册

网站分类

最新文章

热评文章

热门文章

标签列表