公开标签 #AI工具
之前一直用 Xcode 纯手工,后来试了下 Cursor,发现 AI 辅助确实能省不少事,今天就来聊聊怎么配置 Cursor 开发 iOS 项目。Cursor 本质上是 VSCode 的一个 fork 版本,内置了很多 AI 功能。相比 Xcode,它有几个明显的优势:• AI 代码补全更智能,能根据上下文预测下一步要写的代码• 内联编辑很方便,选中代码按 CMD+K 就能让 AI 帮忙重构• 聊天面板可以随时问问题,不用切到浏览器• Agent 模式可以一次性改多个文件Cursor 是收费的,想尝试的
在被DeepSeek的热度覆盖大半年后,Kimi悄悄完成了一次漂亮的反击,其最新模型Kimi K2在LMArena.ai竞技场中,从DeepSeek手中接过全球开源第一的位置。从榜单数据看,Kimi K2在多个维度表现亮眼,尤其在长查询处理、多任务协调等场景中,展现出不输头部闭源模型的实力。比模型排名更值得关注的是Kimi在K2上线前推出的首个Agent产品——Kimi-Researcher(深度研究),这个被团队称为模型即Agent理念实践的产品,藏着Kimi团队对AI产品的独特思考:他们花了大量精力
OmniGen2新一代模型保持简洁架构,显著增强了上下文理解能力、指令遵循能力和图像生成质量,OmniGen2全面继承其基座多模态大模型在上下文理解与生成方面的能力,支持图像和文字生成,进一步打通多模态技术生态,模型权重、训练代码及训练数据将全面开源,为社区开发者提供优化与扩展的基础,这些特性将推动统一图像生成模型从构想向现实转变。OmniGen2采取分离式架构解耦文本和图像,采用ViT和VAE的双编码器策略,与其他工作不同,ViT和VAE独立作用于MLLM和Diffusion Transformer中
Puppeteer Real Browser 是一个基于 Puppeteer 的工具库,模拟真实浏览器的行为,避免在使用自动化脚本时被网站检测为机器人。它可以有效绕过像 Cloudflare 这样的安全服务,能够自动处理验证码(如 Captchas),提升自动化任务的成功率。Puppeteer Real Browser主要通过针对浏览器的最小修改,保持自然状态,确保最佳的运行结果,特别适合需要复杂的用户交互时(例如填写表单、点击按钮等)。安装系统要求:Linux需安装xvfb(虚拟显示服务器)安装命令:
VDraw.ai 是一个基于 AI 的在线作图工具,只需要填写主题,就能创建信息图表、流程图、图书摘要图、PDF 摘要图、笔记图等,可选择模版,快速生成 png 图片。AI智能生成:通过自然语言描述自动生成图表草稿。模板库丰富:覆盖项目管理、软件开发、教育等场景。协作与分享:支持多人实时编辑、评论及云端存储。跨平台兼容:支持网页端、Windows/macOS客户端及移动端访问。核心功能1、AI绘图助手输入文字描述(如“电商订单处理流程”),AI自动生成流程图框架。支持中英文指令,可调整生成结果的复杂度和
photoshot是一款开源的 AI 头像生成器,用户将自己的个人头像上传后,可借助 Stable Diffusion 模型进行训练,并生成一款拥有不同风格的个人头像。核心功能1、AI头像生成通过用户上传照片训练Dreambooth模型,支持自定义训练步数(默认3000步),提供高清图像升级功能(HD版本模型)。2、特色功能智能提示词生成(集成OpenAI API),多风格头像生成,负向提示词过滤(自动排除低质量图像),用户账户系统(支持邮箱注册/登录)。3、商业化功能Stripe支付集成(支持订阅制收
Crawl4LLM是面向大语言模型预训练的高效网络爬虫,为LLM预训练提供高效的网页爬取解决方案,支持多种文档评分策略(基于文本长度、fastText模型评分、随机评分、入链数量等),可智能筛选高质量训练数据。1、环境配置*要求Python ≥3.10环境依赖库:numpy, tqdm, fasttext, pyyaml, wandb硬件建议:ClueWeb22数据集需存放在SSD硬盘以保证爬取效率2、运行爬虫步骤:1、在configs/目录下创建YAML配置文件2、执行命令:python crawl.
HealthGPT是由DCDmllm团队开发的医学多模态大模型,结合了视觉理解与生成能力,采用异构低秩适应(H-LoRA)技术和三阶段训练策略,能够统一处理多种医学任务。技术架构1、多模态融合机制 通过公式$H\text{-}LoRA = \bigoplus_{i=1}^n (W_i \otimes \Delta W_i)$,实现医学图像特征与文本描述的高效融合。其中,$\otimes$代表张量积运算,确保图像与文本信息的深度整合。2、三阶段训练流程 基础预训练:在MIMIC-CXR等百万级医学影像数据
MatAnyone 是由南洋理工大学与商汤科技联合开发的视频抠像框架,为解决复杂背景下的精准人像提取难题而设计。MatAnyone框架通过创新算法实现了三大技术突破:核心技术架构1、一致内存传播机制 采用类似人脑记忆的视频处理方式,通过$CMP_t = \sum_{i=1}^{n} \alpha_i \cdot M_{t-i}$公式实现跨帧信息传递,确保目标对象在多帧视频中的跟踪稳定性。2、区域自适应融合模块 将视频画面划分为核心区域(身体部分)与边界区域(发梢/衣物褶皱),分别采用不同权重进行特征融合
HiveChat 是一款专为中小型团队设计的协作型 AI 对话平台,支持集成 DeepSeek、OpenAI、Claude 等 12 家主流大模型服务商。核心功能模块多模型统一接口通过管理员统一配置 API 密钥,团队成员可无缝调用包括 DeepSeek、Gemini、Moonshot(月之暗面)、火山方舟等在内的多种大模型服务。系统支持 LaTeX/Markdown 公式渲染、思维链展示及图像理解功能。团队协作管理管理员可通过可视化后台完成用户管理(支持手动添加或开放注册)、服务商配置及权限控制,适用