专注分享各种高质量网站、工具、APP、开源项目等一切好玩的东西🚀,以及偶尔开开车🚗

极客分享2.0 @xgeekshare
📮广告合作 @Geekshare_bot
🌐网站:https://geekshare.org/
#AI #大模型

🆕 OpenAI 和 Anthropic 同时发布新模型:又是「史诗级」更新

现在各大 AI 厂商时不时来个大更新,其实我已经无感了,我只关心价格,最近用 Gemini 比较多,无非是便宜而且够用。

OpenAI GPT-5.3-Codex

目前「最能干活、最可靠、最接近“10x 程序员同事」的编码智能体,应该是一个可靠的编程助手!

Anthropic Claude Opus 4.6

目前最强的「深度思考 + 知识工作 + 长上下文代理」模型,特别适合需要高质量规划、纠错、跨领域复杂任务的企业/研究/专业人士。

↗️ 相关阅读

好消息!ZenMux 可限时免费体验两周「Claude Opus 4.6」模型

📮投稿 📢频道 💬群聊 🔎索引
#AI #AI助理

👌 FreeTodo - 一款 AI 驱动的智能待办管理应用

通过对话式 AI 交互和智能任务拆分,FreeTodo 将复杂项目转化为可执行的行动步骤。

官方描述的有点高大上了,其实主要核心功能是这个软件会在后台自动截图与OCR你的一举一动,然后把这些信息整理成可搜索的数据库。最后就是接入 AI 分析你干过的那点事!

像我天天摸鱼的根本不敢用☹️

📮投稿 📢频道 💬群聊 🔎索引
#AI #prompt

💡 概念美术提示词生成器

🐙 开源页面

一个专为 AI 绘画(GPT、Nano Banana 等)设计的结构化提示词生成工具。

通过可视化的「填空」交互方式,帮助用户快速构建、管理和迭代复杂的 Prompt。

📮投稿 📢频道 💬群聊 🔎索引
#AI资讯

Google 发布其最强图像生成模型「Nano Banana Pro」
官方正式名称为「Gemini 3 Pro Image」。它最高可输出 4K 分辨率图像、支持多轮编辑、搜索增强等功能,应该是目前全球最先进的 AI 绘画模型了![博客][直达][提示词大全]

ChatGPT 近期更新
新增全新购物助手功能,用户只需输入购物需求,ChatGPT 就会开始为用户筛选合适的产品;取消了独立的「ChatGPT Voice」入口,现在用户可以直接在聊天中使用语音功能。

Claude Opus 4.5 发布
可智能修复bug、永不遗忘对话,对标 GPT-5.1 和 Gemini Pro。

Black Forest Labs 发布全新开源大模型「FLUX.2」
FLUX.2 有 4 个不同规模和用途的模型包括 Pro、Flex、Dev、Klein,并在技术上实现了显著提升,包括引入多参考条件、更高保真度的输出以及改进的文本渲染。[开源地址][官方博客][FLUX.1介绍]

TRAE SOLO 中国版正式上线
TRAE SOLO 是一种高度自动化的开发方式,以 AI 为主导,可理解目标、承接上下文并调度工具,独立推进各阶段开发任务。且完全免费使用。(TRAE 是字节跳动旗下的 AI 编程工具)[直达]

*题图由 Nano Banana Pro 免费生成

📮投稿 📢频道 💬群聊 🔎索引
#ChatGPT #AI #浏览器

OpenAI 推出 AI 浏览器「ChatGPT Atlas」

直达: chatgpt.com/atlas/

当地时间周二,OpenAI 推出该公司首款由人工智能驱动的网页浏览器

▫️随时唤出侧边栏:点击「Ask ChatGPT」按钮,就能在任意页面右侧打开 ChatGPT 侧边栏。始终带着上下文理解的 ChatGPT 能读取你所在页面的详细内容,能帮你总结内容、解释信息,或者直接在当前窗口里处理任务。

▫️AI 协助功能:在任何打开的文本输入框中输入内容时,ChatGPT 能提供实时修改建议和智能补全,帮你更高效地码字

▫️Agent(代理)模式:能让 ChatGPT 在浏览器中自主完成多步骤任务(目前只对 Plus、Pro 和 Business 用户开放)

不过,目前仅推出了 macOS 版本, Windows、iOS、Android 版本即将推出。

📮投稿 📢频道 💬群聊 🔎索引
#AI #油猴 #脚本

PromptHelper - 通用 AI 助手油猴脚本

一个强大的通用型油猴脚本,为十大主流 AI 平台提供智能化 Prompt 模板管理功能。

支持一键模板应用、智能读取聊天输入内容,以及高级模板管理和站点专属默认设置

📮投稿 📢频道 💬群聊 🔎索引
#AI #求职 #脚本 #自动化

🗞 海投助手 - 一款专为求职者打造的油猴脚本

🐵 油猴脚本

通过自动化操作、AI 辅助等功能,实现快速筛选岗位并自动完成简历投递与消息回复

▫️自动批量发送简历:设置筛选条件后,自动进入每个职位页面并完成简历投递
▫️多条件精准岗位筛选:支持关键词、地区、薪资范围、公司类型等条件过滤
▫️自动回复消息:接收 HR 新消息时,AI 会生成自然语言回复
▫️可视化控制面板管理任务:提供悬浮式可视化面板,随时查看运行状态、调整参数
▫️避免重复投递机制:自动识别已投递过的岗位,防止重复提交


📮投稿 📢频道 💬群聊 🔎索引
#视频处理 #AI #工具

✏️ BiliNote - AI 为你的视频做笔记

⬇️ 下载页面

BiliNote 是一个开源的 AI 视频笔记助手,支持通过哔哩哔哩、YouTube、抖音等视频链接,自动提取内容并生成结构清晰、重点明确的 Markdown 格式笔记。还支持插入截图、原片跳转等功能。

☀️ 使用场景可太多了,学习、洗稿都可以

📮投稿 📢频道 💬群聊 🔎索引
#AI #Claude #大模型

Anthropic 发布「全球最强的」编程大模型:Claude Opus 4 和 Claude Sonnet 4

体验(Sonnet免费): claude.ai/new

Anthropic 称,Opus 4 是目前全球最强的编程大模型,能够稳定胜任复杂且持续时间长的任务和 Agent 工作流。

而 Sonnet 4 则着重强化了编程和推理能力,能更精准地响应用户的指令。

此外,Anthropic 还同步推出了以下新功能:

▫️工具辅助的延伸思考:Claude 模型在进行深入思考时,能够交替使用工具(如网页搜索),以优化推理过程和回复质量。

▫️新增模型能力:两款模型可并行使用工具,执行更精确的指令,并在开发者授权下,提升记忆能力,能提取并保存关键信息,保持上下文连贯。

▫️Claude Code 正式发布:Claude Code 现已支持 GitHub Actions、VS Code 和 JetBrains。

▫️新的 API 功能:Anthropic API 新增四项功能,包括代码执行工具、MCP 连接器、文件 API 和最长可缓存 1 小时的提示缓存功能。


📮投稿 📢频道 💬群聊 🔎索引
#Google #AI

Google 发布最强 AI 全家桶!还有多个重磅产品

今年的 Google I/O 2025 大会上,Google 推出了 Gemini 2.5 Pro/Flash 模型、Imagen 4、Veo3、Lyria RealTime等创作工具,以及 Android XR 眼镜等多个产品。

▫️XR 眼镜「Project Aura」: 搭载 Gemini 2.5 Pro 等新一代多模态基座大模型以及 Project Astra 智能体助理技术,具备实时翻译、视觉搜索、多模态交互等功能

▫️AI Mode 搜索体验:用户在进行复杂查询时,可获得更智能的反馈。此功能支持多模态输入,能根据上下文进行深入推理,帮助用户快速生成专业级引用报告,还使通过摄像头实时提问。

▫️Gemini2.5Pro和Flash版本:新版本 Deep Think 功能可在生成答案前考虑多个假设,使模型在测试中表现优异;Flash版本减少计算资源需求,提升用户在编程等任务中的体验。

▫️多个创造工具:AI 视频生成模型 Veo3、AI 图像生成工具 Imagen4、AI 音乐生成工具 Lyria。

▫️全新的订阅服务 Google AI Ultra:该计划为专业用户提供 Google 最强大模型和高级功能的无限制访问,适合电影制作人、开发者、创意工作者等专业人士,月费为 249.99 美元(折合人民币 1804 元)。


📮投稿 📢频道 💬群聊 🔎索引
#AI资讯

内容比较多,点开查看

马斯克宣布 Grok 语音模式正式上线:支持10种模式,还包括18+选项。仅支持英文,貌似需要升级才能使用。

Anthropic 推出混合推理模型「Claude 3.7 Sonnet」:旨在解决更复杂的问题,并在数学和编码等领域展现出超越以往的性能。[介绍][免费使用]

​ChatGPT 新增 Safari 扩展功能:可设置 为Safari 地址栏默认搜索引擎

今天,OpenAI 免费开放了基于GPT-4o mini 的 ChatGPT 高级语音聊天模式

Perplexity AI 推出新全浏览器 Comet:专注于 “代理搜索” 功能,以「智能体搜索」为核心概念。[加入候补]

Google 推出编程助手「Gemini Code Assist」:每月 18 万次免费代码补全。[直达]

瑞典公司 lovable 推出无代码构建应用 AI 工具:无需任何编程基础,只需要提示词即可开发一个完整的应用软件。现在该平台每天生成超过25000个新产品。[直达]

Exa 发布 AI 搜索工具「Websets」:用户可以通过 Websets 执行如“美国市值前50的AI创业公司CEO信息”这样的复杂查询,可实现一次性读取并分析超过1000+网页数据并生成结构化的结果表格。[直达]
#开源 #字幕 #视频处理 #AI

🅰️ 卡卡字幕助手 - 一个基于 AI 的视频字幕处理工具

下载页面

卡卡字幕助手支持语音识别、字幕断句、优化、翻译全流程处理

特色功能是基于 LLM 的智能分割与断句,字幕阅读更自然流畅

📮投稿 📢频道 💬群聊 🔎索引
#AI #大模型 #聊天助手

Nous Research 推出了 AI 聊天机器人「Nous Chat」

直达: hermes.nousresearch.com


Nous Chat 是一个基于Meta Llama 3.1微调而成的「Hermes 3-70B」模型,支持线程式对话(讨论的主题更加专注),

此 AI 旨在帮助用户组织思路、整理想法和项目,致力于“以人为本”的交互体验。支持中文,目前免费使用!


📮投稿 📢频道 💬群聊 🔎索引
#AI资讯

谷歌I/O开发者大会要点一览


将在美国推出「AI概览」功能,搜索引擎会总结搜索结果
谷歌搜索将具备多步骤推理能力,可以一次性处理带有多个限制条件的长问题,并支持拍视频搜索
Gemini 1.5 Pro 大模型在今年将会把100万Tokens的窗口扩大至200万
推出 Gemini 1.5 Flash 模型,服务于需要快速响应的场景
推出参数量更大的Gemma 2
发布了文生图工具 Imagen 3、与 Youtube&音乐家合作的「AI音乐沙盒」,以及最新的视频生成模型Veo
Gemini Nano 模型将在今年晚些时候登陆 Pixel 手机并能在本地运行
从今年夏天开始,Gemini 将支持语音实时交互,还将上线实时视频交互
将推出「Gems」自定义 AI 助手功能,并与谷歌全家桶联动
宣布第六代 TPU 芯片 Trillium, 较上一代算力表现翻 4.7 倍,下半年起投入使用
谷歌云在明年初用上英伟达最新的 Blackwell 架构 GPU
#AI资讯

谷歌发布 CodeGemma AI 模型:目标打造最强代码辅助工具(在线体验

谷歌 Imagen 2 新增文生动图功能:可创作 4 秒动态图片,每秒 24 帧(更多介绍

开源 AI 视频理解模型「MiniGPT4-Video」发布:能够处理时间视觉和文本数据,使其能够熟练地理解视频的复杂性(在线体验

OpenAI 发布最新模型「GPT-4 Turbo with Vision」:新增视觉处理功能,并且视觉请求支持 JSON 格式和函数调用方式(官方介绍

马斯克:特斯拉大模型 Grok 2.0 版本的性能将好于ChatGPT-4,可能在两年内实现
#AI #聊天助手 #大模型

🤖AI 聊天助手「Pi」迎来史诗级增强,全面提升智商、情商

Inflection 正式发布 「Inflection-2.5」 大语言模型,让 Pi 聊天机器人更聪明,也更富有同情心

现在 Pi 不仅拥有强大的基础能力,可与 GPT-4、Gemini 等 LLM 相媲美,且还融入了个性化特点和独特的同理心微调,换言之更加像一个「人」

📈Pi 每天有超过一百万活跃用户,用户平均对话时长为 33 分钟,而每天有十分之一的用户与 Pi 的对话时长超过一小时,可见其粘性之高!

体验:https://pi.ai/


📑相关阅读

Pi - 一个 AI「知心朋友」

📮投稿 📢频道 💬群聊 🔎索引
#AI #硬件

🐰AI 硬件 Rabbit R1 发布

Rabbit R1 的大小约为 iPhone 的一半,配有一块 2.88 英寸触摸屏、一个旋转摄像头,以及可用于导航或与设备内置助手交谈的滚轮/按钮

它搭载了联发科 2.3GHz 处理器、4GB 内存和 128GB 存储空间

操作系统并非基于 ChatGPT 之类的大型语言模型,而是基于「大行为模型」

Rabbit OS 可以通过一个界面,控制音乐、订购车辆、购买杂货、发送消息等。无需切换应用程序,只要说出你的需求,Rabbit R1 就能为你服务。

Rabbit 在发布后的一天内便售出了 10000 件
#ChatGPT #AI #生产力 #开源

🤖️GPT Crawler - 将网站变成自定义 GPT

▶️演示教程

📄运行该项目,输入网址,然后项目会爬取该网站所有内容并生成 Json 文件,然后它会将该文件喂给 ChatGPT,打造个人知识库或者智能助理

我感觉非常实用,尤其是面对密密麻麻的英文开发文档之时,可以直接与其对话


📮投稿 📢频道 💬群聊 🔎索引
#AI #工具 #论文 #阅读

📖SCISPACE - 一个基于 AI 的科研论文阅读工具

📄通过 SCISPACE 你可以更好地阅读理解研究论文,它可以用简明易懂的语言解释和阐释大多数学术论文中的内容

借助这个工具,普通人也可以轻松地获取高价值知识,这就是 AI 的意义

⚙️使用

1️⃣进入首页,你可以用关键词直接搜索相关论文,在右上角选择「Chinese」之后可以在结果页面查看由 AI 生成的中文标题,这样就可以快速定位想要查看的论文

2️⃣进入论文页面,左边是论文,右边是 Copilot 对话栏,这时候你就可以与该论文进行对话了,可以选择中文

用鼠标划选文字,还可以对选中文字进行总结、提问、搜索相关论文操作

3️⃣注册之后点击右上角「My Library」还可以上传 PDF 文件进行 AI 辅助阅读

4️⃣此外,它还支持浏览器插件、文献综述、检测论文是否 AI 生成等工具,自行探索,全部功能都可以免费试用,但是有限制,你可以付费升级

📮投稿 📢频道 💬群聊
#AI绘画 #AI #开源 #StableDiffusion

🔄全球最顶级的开源 AI 绘画模型「Stable Diffusion XL 1.0」发布!

👉体验1 | 👉体验2 | 🌐开源地址

📃距离我上次推送 SDXL 0.9 发布已经快一个月了,这次 SDXL 再次迭代升级到了 1.0。效果提升巨大,赶超 Midjourney 指日可待!

⚠️体验1地址中免费用户在线体验需要排队,体验2地址有一定的免费额度,想要完全无限制体验可以自己部署

🔄更新内容

SDXL 1.0 拥有一个 35 亿参数的基础模型和一个 66 亿参数的细化模型,是目前所有开放式图像模型中参数数量最多的模型之一

相比之前的版本生成,色彩更鲜艳、准确度、对比度、光照和阴影更佳,以及可以生成一般图像模型难以渲染的概念

你现在可以用更简单的提示词生成图像了,并且模型对提示词的理解更加智能,甚至可以分清红场(俄罗斯红场)和红场(红色的广场)之间的区别

📑相关阅读

Prompt 网站合集 - 帮助你用好 AI
Clipdrop - 一款在线的 AI 修图工具
Stable Diffusion XL 0.9 发布,AI 生成图像飞跃式提升

📮投稿 📢频道 💬群聊
 
 
Back to Top