+ 我要发布
我发布的 我的标签 发现
公开标签 #大模型
论文标题:JAILJUDGE: A Comprehensive Jailbreak Judge Benchmark with Multi-Agent Enhanced Explanation Evaluation Framework论文地址:https://www.researchgate.net/publication/384848143_JAILJUDGE_A_Comprehensive_Jailbreak_Judge_Benchmark_with_Multi-Agent_Enhanced_Expl
大模型 Agent,作为一种人工智能体,是具备环境感知能力、自主理解、决策制定及执行行动能力的智能实体。简而言之,它是构建于大模型之上的计算机程序,能够模拟独立思考过程,灵活调用各类工具,逐步达成预设目标的智能存在。Agent 是 AI 大模型应用的主要新形态,在技术架构范式也发生了很大的变化,从面向过程的架构变成了面向目标架构。大模型虽作为智能体的核心“大脑”,负责思维与决策,但仅凭此并不足以胜任复杂任务的执行。为了全面实现智能体的功能,还需融入类似“神经感官系统”以感知环境,以及“肢体”以执行实际动
Ollama是一个开源的项目,设计用于简化大模型(LLM)的部署和使用流程。它允许用户下载并本地运行像 Llama 3、Code Llama、Gemma、Mistral 等大模型,并支持自定义和创建自己的大模型。 Ollama支持 macOS 、Linux 操作系统和 Windows preview。此外 Ollama还提供了官方的 Docker 镜像,使得使用 Docker 容器部署大模型变得更加简单。Ollama 支持 GPU 加速,并提供了简单的命令行界面(CLI)以及用于与应用程序交互的 RES
在前不久举行的 FOSDEM 2024 会议上,有多场演讲探讨了开源 AI、许可证中的伦理限制和开源数据集。训练大模型需要投入大量的算力和资金,企业如 OpenAI 既没有公开模型也没有发布数据集,但这没有阻止各类企业和组织发布开源大模型,这些开源模型使用了不同的许可证,有着不同的限制。以 Meta 的 Llama 2 大模型为例,它禁止将大模型用于暴力或恐怖活动,以及“任何其他犯罪活动”。欧洲自由软件基金会(FSFE)的项目经理 Niharika Singhal 认为,为了维护 AI 的“开放性”,A
两年前,总部位于旧金山的OpenAI公司的研究人员尤里·布尔达(Yuri Burda)和哈里·爱德华兹(Harri Edwards)试图找出如何才能让语言模型进行基本的算术运算。他们想知道模型需要看到多少个将两个数字相加的示例,然后才能将他们给出的任何两个数字相加。起初,事情进展得不太顺利。模型记住了他们看到的总和,但未能解决新的总和。 出乎意料的是,布尔达和爱德华兹让他们的一些实验运行的时间比他们想要的要长得多——几天而不是几小时。这些模型一遍又一遍地向模型显示示例总和,远远超过了研究人员本来会称之为
2024 年,国产大模型的第一个重磅消息,来自智谱 AI。 在 1 月 16 日举办的 2024 智谱 AI 技术开放日 Zhipu DevDay 上,智谱 AI 正式发布新一代基座大模型「GLM-4」。 经历了三个月的技术迭代,GLM-4 相比上一代基座模型 GLM-3 实现了 60% 的性能全面提升,直接逼近 GPT-4。 一方面,GLM-4 支持更长的上下文、更强的多模态能力;另一方面,GLM-4 支持更快的推理、更多并发,大大降低了推理成本。 同时,GLM-4 也增强了智能体能力,智谱 AI 正
应用开发者的疑问:大模型是真正的银弹吗? ▶ 被当成银弹的大模型 ChatGPT 火了之后,大模型似乎被当成了真正的银弹,所有的体验问题都想通过大模型解决: 能不能和大模型对话订机票? 自然语言生成 SQL,简化报表分析工作? 大模型帮老年人操作软件? 能不能用于识别敏感信息? ...... 似乎大模型成了自然语言工程领域的真正银弹。但是我依稀记得 《人月神话》作者 Fred Brooks 所说的 “软件工程没有银弹”;以及华尔街投资大师们说的 “当所有人都在谈论一件事情的时候,说明这件事情已经出现了
1