DeepSeek黑科技来袭:入门到企业案例学习 众筹个课,人凑够之后收钱,具体金额看人数定。目前有三个人。还有愿意的联系 @ashbur_bot
Agent Leaderboard:面向AI Agent的大语言模型排行榜,一站式展示顶尖LLM for AI Agent的性能与实力。目前排第一位的是gemini-2.0-flash-001,绝对的高性能高性价比之首选。 实时更新,掌握最新AI智能体动态;多维度性能评估,全面了解智能体优势;社区互动,与开发者共同探讨前沿技术
GPU Programming(可视化GPU编程教程):带你深入探索GPU编程的世界,从基础到高级,轻松掌握并行计算的核心技能 11个精心制作的视频教程,涵盖从入门到进阶的全部知识点;超过1.6万次观看,学习者反馈极佳;深入解析GPU架构与性能优化,助力高效开发
Hugging Face NLP Course:一站式自然语言处理学习平台,从零到精通的NLP知识宝库,最新更新了监督微调(SFT)的相关内容。 免费提供前沿NLP技术课程;实战案例丰富,涵盖Chat Templates、Supervised Fine-Tuning等;持续更新,新增章节聚焦热门技术
Unionlabs/Union:去信任的零知识桥接协议,为抗审查、超高安全性和去中心化金融而生。 零知识证明技术,保障隐私与安全;跨链兼容性强,连接EVM和Cosmos生态
Awesome Isaac Gym:NVIDIA Isaac Gym的精选资源库,助力机器人学习与强化学习研究。 汇集相关优质框架、论文和工具;提供丰富的学习材料和视频教程;支持多种强化学习框架,加速机器人开发
Awesome-Vison2Audio:视频转音频生成的资源库,为视频创作者和开发者提供一站式解决方案。 汇集了从2016年到2024年的前沿研究成果,涵盖100+篇相关论文;提供丰富的开源代码和在线演示,助力快速上手;涵盖音乐、音效、语音等多种音频生成场景,满足多样化需求
Awesome-Multimodal-Chain-of-Thought:一站式多模态思维链研究资源库。 汇集多模态思维链领域前沿论文与代码库;涵盖多种模态数据融合技术,助力复杂问题解决;提供丰富的研究思路与实践范例,推动多模态AI创新
为数据库交互打造的开源GenAI工具箱,让开发者轻松构建与数据库交互的生成式AI应用。 简化开发流程,集成工具仅需不到10行代码;提供连接池、认证等最佳实践,性能提升显著;内置OpenTelemetry支持,实现端到端可观测性 Gen AI Toolbox for Databases | #工具
simple_GRPO:一个简单的 GRPO(Generative Reinforcement Learning for Policy Optimization)实现,旨在复现类似 r1 的大型语言模型(LLM)思维过程。 仅200行代码,依赖极少,快速上手;分离式参考模型,可在不同GPU上运行,节省显存;1小时内完成训练,快速观察到模型的“顿悟时刻”
Open-R1-Video:为视频理解任务引入R1范式,开源训练代码和数据,助力多模态模型的高效训练 仅用视频、查询和答案即可训练,无需额外标注;使用GRPO训练,显著提升模型推理能力;开源数据集包含4K视频,适配多种硬件环境
Frames of Mind: Animating R1's Thoughts:旨在通过将 R1 的思考链转换为文本,然后使用 OpenAI API 将文本转换为嵌入,并通过 t-SNE 序列绘制这些嵌入,来可视化 R1 的思考过程。 利用t-SNE技术将文本嵌入转化为动态图表,直观呈现AI的“思考路径”;提供连续思考步骤的距离分析,精准捕捉思维跳跃;支持多种问题类型的可视化,帮助理解AI的决策逻辑
为学术项目打造的优雅网页模板,用React和UIKit搭建,支持Markdown和KaTeX公式,轻松搞定学术项目展示。 仅需一个`template.yaml`文件,配置轻松搞定;自动部署到GitHub Pages,零配置;支持自定义主题,适配多种学术风格 Academic Project Page Template | #模板
Awesome-Robotics-Diffusion:机器人学习领域的扩散模型精选资源库。 汇集了40多篇前沿的机器人学习与扩散模型结合的学术论文;涵盖多种机器人任务,如操作、导航、规划等;提供丰富的代码和数据资源,助力研究和开发
一个机器学习的交互式、可视化教学项目 这是亚马逊推出的教育计划,期望以有趣、信息丰富且易于理解的方式教授重要的机器学习概念。该平台涵盖了神经网络、机会均等、逻辑回归、线性回归、强化学习等多个核心机器学习主题。每个主题篇幅不长,主要还是入门知识。 MLU-EXPLAIN | #机器学习
此仓库收集了用于学习人工智能和机器学习的免费资源。内容涵盖: AI/ML关键概念 列出了AI/ML的核心概念,如监督学习、无监督学习、强化学习、深度学习、自然语言处理、计算机视觉、生成对抗网络等,并附有相关链接供进一步学习。 AI/ML构建模块 涉及学习AI/ML所需的基础知识,包括线性代数、概率统计、优化计算、Python编程、数据预处理、模型评估等。 AI/ML角色 介绍了与AI/ML相关的多种职业角色,如机器学习工程师、数据科学家、ML/AI平台工程师等。 AI/ML发展路线图 提供了一套系统的学习路径,从数学基础到实践经验,再到专业领域知识和MLOps,最后是研究和面试准备。 课程、认证、书籍、工具与框架 分别列出了适合学习AI/ML的课程、认证项目、书籍、工具和框架,为学习者提供了丰富的学习资源。 研究博客、应用博客、问题、社区、频道、新闻简报和必读论文 提供了AI/ML领域的研究博客、应用博客、实践问题、社区资源、YouTube频道、新闻简报以及必读论文,帮助学习者紧跟行业动态并深入研究。 Awesome AI/ML Resources | #机器学习
DeepSeek发布了一项新的成果,CodeI/O 通过代码输入-输出预测提炼推理模式 | 详文 这项研究提出了一种名为CoDEI/O的新方法,用来提升大型语言模型(如ChatGPT等)的推理能力。传统方法通常专注于训练模型解决数学题或生成代码,但其他类型的推理任务(如逻辑推理、科学推理)由于缺乏高质量的训练数据,效果往往不佳。 这项研究的核心思路是:用代码教模型“解题思维” 代码中其实隐藏着丰富的“解题套路”。例如,一段计算阶乘的代码,本质上包含了“从1连乘到n”的数学推理步骤。CoDEI/O的巧妙之处在于: 1. 把代码变成“输入-输出”练习题:给定一个代码函数和输入,让模型预测输出;或者给定代码和输出,让模型反推输入。 2. 用自然语言描述推理过程:模型需要像学生写解题步骤一样,用文字说明“为什么输入A会得到输出B”,而不是直接生成代码。这种“思维链”训练让模型学会通用的推理方法,比如如何拆解问题、如何验证条件等。 如何实现? ⭐️收集代码:从算法题库、数学问题等来源筛选45万多个代码函数。 ⭐️生成练习题:为每个代码函数自动生成多组输入输出对,例如测试阶乘函数时,输入5对应输出120。 ⭐️让模型“写解题步骤”:使用一个强大的开源模型(DeepSeek-V2.5)为每个练习题生成自然语言的推理过程。 ⭐️纠错升级(CoDEI/O++):如果模型预测错误,系统会通过执行代码得到正确答案,并让模型根据反馈重新生成推理步骤。类似老师批改作业后让学生订正。 效果如何? ⭐️在14个不同类型的推理测试中(涵盖数学、逻辑、常识等),经过CoDEI/O训练的模型表现更全面: ⭐️不偏科:传统方法可能在数学题上得分高,但逻辑题得分低,而CoDEI/O在所有任务中均有提升。 ⭐️验证可靠:模型的推理步骤可以通过代码执行直接验证,确保正确性。 ⭐️开源共享:所有训练数据和模型已公开(GitHub),方便后续研究。 总结一下,CodeI/O 就像是一种新的“思考训练营”,它利用代码这种结构化的信息,让AI学习更通用、更可靠的推理能力。(以上内容是deepseek根据论文生成的)