大模型

穿越数字边界：网络自由的探索

置顶穿越数字边界：网络自由的探索

点击直达在当今数字化的世界里，网络自由是无价的，但有时也受到了地理和政治界限的限制。有一种方法，一种隐藏的方式，让我们能够穿越这些数字边界，实现网络自由。这个方法有点像背后的秘密通道，允许您访问被封锁或限制的网站，享...

2023-10-20 2.95 K 阅读 0 评论

愤怒的蜗牛

掘金俄罗斯电商蓝海！Ozon——中国卖家的黄金机遇

置顶掘金俄罗斯电商蓝海！Ozon——中国卖家的黄金机遇

目前俄罗斯ozon在国内正处于超级红利期，平台自然流量很大，基本能做到上架即出单的地步，ozon官方计划在2024年要招商满10万卖家入入驻，乾坤未定，你我皆是黑马！平台现在跟13年的淘宝一样正在蓄力爆发，跨境电商时...

2025-03-02 1.18 K 阅读 0 评论

愤怒的蜗牛

🚀 Ozon无货源模式全攻略！低成本启动，轻松月入过万！

置顶🚀 Ozon无货源模式全攻略！低成本启动，轻松月入过万！

想进军俄罗斯电商市场，却担心门槛高、操作难？Ozon无货源模式让你0囤货、0风险、轻松赚钱！只需每天2小时，就能在俄罗斯开店！第一步：了解Ozon平台——轻松上手，0门槛副业Ozon平台支持无货源玩法，只需出一单发一...

2025-03-03 2.06 K 阅读 0 评论

愤怒的蜗牛

大模型不再是路痴！空间推理的答案是RAG：旅游规划、附近推荐全解锁

大模型不再是路痴！空间推理的答案是RAG：旅游规划、附近推荐全解锁

近年来，大型语言模型（LLMs）的进展已经在机器学习（ML）的许多领域带来了变革，特别是在理解和生成类人文本方面，激发了人们通过直接从LLMs中提取空间知识来弥合空间问答与自然语言之间的差距，研究成果涵盖了广泛的应用...

2025-03-28 465 阅读 0 评论

愤怒的蜗牛

新注意力让大模型上下文内存占用砍半！精度不减还能加速2倍

新注意力让大模型上下文内存占用砍半！精度不减还能加速2倍

大模型同样的上下文窗口，只需一半内存就能实现，而且精度无损？前苹果ASIC架构师Nils Graef，和一名UC伯克利在读本科生一起提出了新的注意力机制Slim Attention。它以标准多头注意力（MHA）为基准...

2025-03-13 327 阅读 0 评论

愤怒的蜗牛

1-bit大模型还能再突破！新一代BitNet架构启用4位激活值

1-bit大模型还能再突破！新一代BitNet架构启用4位激活值

量化到1 bit的LLM还能再突破？这次，他们对激活值下手了！近日，BitNet系列的原班人马推出了新一代架构：BitNet a4.8，为1 bit大模型启用了4位激活值：图片论文地址：https://arxiv.o...

2024-12-01 361 阅读 0 评论

愤怒的蜗牛

大模型“取长补短”新思路入选NeurIPS'24，显著优于现有路由方法，南科大港科大出品

大模型“取长补短”新思路入选NeurIPS'24，显著优于现有路由方法，南科大港科大出品

高效组合多个大模型“取长补短”新思路，被顶会NeurIPS 2024接收。名为RouterDC，是一种基于双重对比学习的路由架构，具有参数高效性（小于100M的参数）和计算高效性（不需要对于LLM进行梯度回传）的优势...

2024-11-12 386 阅读 0 评论

愤怒的蜗牛

大模型引领6G革命！最新综述探索「未来通信方式」：九大方向，覆盖多模态、RAG等

大模型引领6G革命！最新综述探索「未来通信方式」：九大方向，覆盖多模态、RAG等

在当今这个快速发展的科技世界，人们很容易被最新的技术成果所吸引。而通信行业也不例外，随着5G网络的普及，6G的蓝图已经在学术界展开。那么，未来的网络将如何应对前所未有的数据传输速率、亚毫秒级延迟和全球无缝连接的复杂挑...

2024-10-19 432 阅读 0 评论

愤怒的蜗牛

大模型之问，究竟是起点还是尾声？

大模型之问，究竟是起点还是尾声？

大模型的上半场是“底座”，互联网巨头都希望能够调制出一个优质的底座系统一统江湖。本着“数据即一切，规模即一切”的逻辑，让AGI迅速成为一个资本狂热的游戏。然而，热热闹闹之后，大家还是会考虑如何变现的实际问题。于是，大...

2024-10-17 419 阅读 0 评论

愤怒的蜗牛

大模型步入「推理Scaling」时代，SambaNova如何挑战英伟达的霸主地位？

大模型步入「推理Scaling」时代，SambaNova如何挑战英伟达的霸主地位？

OpenAI o1 的发布，再次给 AI 领域带来了一场地震。o1 能像人类一样「思考」复杂问题，拥有优秀的通用推理能力。在未经专门训练的情况下，o1 能够直接拿下数学奥赛金牌，甚至能在博士级别的科学问答环节上超越人...

2024-10-17 457 阅读 0 评论

愤怒的蜗牛

大模型「强崩溃」！Meta新作：合成数据有「剧毒」，1%即成LLM杀手

大模型「强崩溃」！Meta新作：合成数据有「剧毒」，1%即成LLM杀手

1%的合成数据，就让LLM完全崩溃了？7月，登上Nature封面一篇论文证实，用合成数据训练模型就相当于「近亲繁殖」，9次迭代后就会让模型原地崩溃。论文地址：https://www.nature.com/articl...

2024-10-14 478 阅读 0 评论

愤怒的蜗牛

文心大模型赋能商业智能助手的探索与实践

文心大模型赋能商业智能助手的探索与实践

一、商业信息查询介绍首先来介绍一下商业信息查询的应用场景。商务合作：评估合作伙伴的资质和规模，判断合作潜力。销售展业：快速获取目标企业的有效联系方式，加速业务推进。成本控制：通过了解供应商的成本结构和心理底价，运用博...

2024-10-09 507 阅读 0 评论

愤怒的蜗牛

大模型微调：Hugging Face Transformers全流程实战转载

大模型微调：Hugging Face Transformers全流程实战转载

随着大模型在人工智能领域的兴起，如何将其应用于垂直领域成为关键问题。本文描述了模型微调技术，通过调整预训练模型的参数，使其适应特定任务，从而提升模型在特定领域的表现。文中以 Yelp 数据集为例，详细介绍了如何使用...

2024-09-26 478 阅读 0 评论

愤怒的蜗牛

大模型边推理边纠错，有可能做到吗？这是ICML爆火的演讲

大模型边推理边纠错，有可能做到吗？这是ICML爆火的演讲

即便是最强大的语言模型（LLM），仍会偶尔出现推理错误。除了通过提示词让模型进行不太可靠的多轮自我纠错外，有没有更系统的方法解决这一问题呢？来自 Meta FAIR、CMU 和 MBZUAI 的叶添、徐子诚、李远志、...

2024-09-07 433 阅读 0 评论

愤怒的蜗牛

大模型终端部署新趋势：硬件直接支持混合矩阵乘法

大模型终端部署新趋势：硬件直接支持混合矩阵乘法

在人工智能领域，模型参数的增多往往意味着性能的提升。但随着模型规模的扩大，其对终端设备的算力与内存需求也日益增加。低比特量化技术，由于可以大幅降低存储和计算成本并提升推理效率，已成为实现大模型在资源受限设备上高效运行...

2024-08-19 628 阅读 0 评论

愤怒的蜗牛