AI工具

公开标签 #AI工具

iOS开发 AI工具

之前一直用 Xcode 纯手工，后来试了下 Cursor，发现 AI 辅助确实能省不少事，今天就来聊聊怎么配置 Cursor 开发 iOS 项目。Cursor 本质上是 VSCode 的一个 fork 版本，内置了很多 AI 功能。相比 Xcode，它有几个明显的优势：• AI 代码补全更智能，能根据上下文预测下一步要写的代码• 内联编辑很方便，选中代码按 CMD+K 就能让 AI 帮忙重构• 聊天面板可以随时问问题，不用切到浏览器• Agent 模式可以一次性改多个文件Cursor 是收费的，想尝试的

从高考志愿到网络热梗都能轻松上手的Kimi首个Agent：Kimi-Researcher

AI工具

在被DeepSeek的热度覆盖大半年后，Kimi悄悄完成了一次漂亮的反击，其最新模型Kimi K2在LMArena.ai竞技场中，从DeepSeek手中接过全球开源第一的位置。从榜单数据看，Kimi K2在多个维度表现亮眼，尤其在长查询处理、多任务协调等场景中，展现出不输头部闭源模型的实力。比模型排名更值得关注的是Kimi在K2上线前推出的首个Agent产品——Kimi-Researcher（深度研究），这个被团队称为模型即Agent理念实践的产品，藏着Kimi团队对AI产品的独特思考：他们花了大量精力

智源开源AI绘图神器 OmniGen2

AI工具

OmniGen2新一代模型保持简洁架构，显著增强了上下文理解能力、指令遵循能力和图像生成质量，OmniGen2全面继承其基座多模态大模型在上下文理解与生成方面的能力，支持图像和文字生成，进一步打通多模态技术生态，模型权重、训练代码及训练数据将全面开源，为社区开发者提供优化与扩展的基础，这些特性将推动统一图像生成模型从构想向现实转变。OmniGen2采取分离式架构解耦文本和图像，采用ViT和VAE的双编码器策略，与其他工作不同，ViT和VAE独立作用于MLLM和Diffusion Transformer中

Puppeteer Real Browser：防止被检测为机器人的工具，支持通过验证码

AI工具爬虫蜘蛛

Puppeteer Real Browser 是一个基于 Puppeteer 的工具库，模拟真实浏览器的行为，避免在使用自动化脚本时被网站检测为机器人。它可以有效绕过像 Cloudflare 这样的安全服务，能够自动处理验证码（如 Captchas），提升自动化任务的成功率。Puppeteer Real Browser主要通过针对浏览器的最小修改，保持自然状态，确保最佳的运行结果，特别适合需要复杂的用户交互时（例如填写表单、点击按钮等）。安装系统要求：Linux需安装xvfb（虚拟显示服务器）安装命令：

VDraw.ai：基于 AI 的在线作图工具

AI工具

VDraw.ai 是一个基于 AI 的在线作图工具，只需要填写主题，就能创建信息图表、流程图、图书摘要图、PDF 摘要图、笔记图等，可选择模版，快速生成 png 图片。AI智能生成：通过自然语言描述自动生成图表草稿。模板库丰富：覆盖项目管理、软件开发、教育等场景。协作与分享：支持多人实时编辑、评论及云端存储。跨平台兼容：支持网页端、Windows/macOS客户端及移动端访问。核心功能1、AI绘图助手输入文字描述（如“电商订单处理流程”），AI自动生成流程图框架。支持中英文指令，可调整生成结果的复杂度和

photoshot 开源 AI 头像生成器

AI工具

photoshot是一款开源的 AI 头像生成器，用户将自己的个人头像上传后，可借助 Stable Diffusion 模型进行训练，并生成一款拥有不同风格的个人头像。核心功能1、AI头像生成通过用户上传照片训练Dreambooth模型，支持自定义训练步数（默认3000步），提供高清图像升级功能（HD版本模型）。2、特色功能智能提示词生成（集成OpenAI API），多风格头像生成，负向提示词过滤（自动排除低质量图像），用户账户系统（支持邮箱注册/登录）。3、商业化功能Stripe支付集成（支持订阅制收

Crawl4LLM：面向大语言模型预训练的高效网络爬虫

AI工具网络爬虫

Crawl4LLM是面向大语言模型预训练的高效网络爬虫，为LLM预训练提供高效的网页爬取解决方案，支持多种文档评分策略（基于文本长度、fastText模型评分、随机评分、入链数量等），可智能筛选高质量训练数据。1、环境配置*要求Python ≥3.10环境依赖库：numpy, tqdm, fasttext, pyyaml, wandb硬件建议：ClueWeb22数据集需存放在SSD硬盘以保证爬取效率2、运行爬虫步骤：1、在configs/目录下创建YAML配置文件2、执行命令：python crawl.

HealthGPT 医疗大规模视觉语言模型：整合视觉理解与生成能力，支持多种医学任务

AI工具

HealthGPT是由DCDmllm团队开发的医学多模态大模型，结合了视觉理解与生成能力，采用异构低秩适应(H-LoRA)技术和三阶段训练策略，能够统一处理多种医学任务。技术架构1、多模态融合机制通过公式$H\text{-}LoRA = \bigoplus_{i=1}^n (W_i \otimes \Delta W_i)$，实现医学图像特征与文本描述的高效融合。其中，$\otimes$代表张量积运算，确保图像与文本信息的深度整合。2、三阶段训练流程基础预训练：在MIMIC-CXR等百万级医学影像数据

MatAnyone 人体视频抠像框架

AI工具视频工具抠图工具

MatAnyone 是由南洋理工大学与商汤科技联合开发的视频抠像框架，为解决复杂背景下的精准人像提取难题而设计。MatAnyone框架通过创新算法实现了三大技术突破：核心技术架构1、一致内存传播机制采用类似人脑记忆的视频处理方式，通过$CMP_t = \sum_{i=1}^{n} \alpha_i \cdot M_{t-i}$公式实现跨帧信息传递，确保目标对象在多帧视频中的跟踪稳定性。2、区域自适应融合模块将视频画面划分为核心区域（身体部分）与边界区域（发梢/衣物褶皱），分别采用不同权重进行特征融合

HiveChat：专为中小团队设计的AI聊天应用

AI工具

HiveChat 是一款专为中小型团队设计的协作型 AI 对话平台，支持集成 DeepSeek、OpenAI、Claude 等 12 家主流大模型服务商。核心功能模块多模型统一接口通过管理员统一配置 API 密钥，团队成员可无缝调用包括 DeepSeek、Gemini、Moonshot（月之暗面）、火山方舟等在内的多种大模型服务。系统支持 LaTeX/Markdown 公式渲染、思维链展示及图像理解功能。团队协作管理管理员可通过可视化后台完成用户管理（支持手动添加或开放注册）、服务商配置及权限控制，适用