GitHUb

GitHub

Douyin_TikTok_Download_API 是一个开箱即用的高性能异步抖音、快手、TikTok、Bilibili数据爬取工具，支持API调用，在线批量解析及下载。本项目是基于 PyWebIO，FastAPI，HTTPX，快速异步的抖音/TikTok数据爬取工具，并通过Web端实现在线批量解析以及下载无水印视频或图集，数据爬取API，iOS快捷指令无水印下载等功能。你可以自己部署或改造本项目实现更多功能，也可以在你的项目中直接调用scraper.py或安装现有的pip包作为解析库轻松爬取数据。

Fugaku-LLM/DeepSpeedFugaku

GitHub LLM AI

日本的一个研究小组发布了Fugaku-LLM，一个大型语言模型(1)具有增强的日语能力，使用RIKEN超级计算机Fugaku。该团队由东京工业大学的Rio Yokota教授、东北大学的Keisuke Sakaguchi副教授、富士通株式会社的Koichi Shirahata、RIKEN的Mohamed Wahib团队负责人、名古屋大学的Koji Nishiguchi副教授、CyberAgent， Inc的Shota Sasaki和Kotoba Technologies Inc.的Noriyuki Koj

ChatGLM-6B: An Open Bilingual Dialogue Language Model | 开源双语对话语言模型

AI GitHub

ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型，基于 General Language Model (GLM) 架构，具有 62 亿参数。结合模型量化技术，用户可以在消费级的显卡上进行本地部署（INT4 量化级别下最低只需 6GB 显存）。 ChatGLM-6B 使用了和 ChatGPT 相似的技术，针对中文问答和对话进行了优化。经过约 1T 标识符的中英双语训练，辅以监督微调、反馈自助、人类反馈强化学习等技术的加持，62 亿参数的 ChatGLM-6B 已经能生成相当符合人类偏好的回答

2023 年 Github 十大编程语言排行榜

GitHub

GitHub 发布了 2023 年平台上使用最多的编程语言，排名前十的分别是：JavaScript、Python TypeScript、Java、C#、C++、PHP、C、Shell、Go。 JavaScript 依然稳居最常用编程语言的宝座，并且在 Web 开发领域发挥着核心作用。JavaScript 作为客户端脚本语言，它使得网页能够执行动态内容的生成，从而提供更加丰富和交互的用户体验。全球企业普遍采用 JavaScript 来构建 Web 应用程序，得益于 Vue、React 和 Angular

TeleMonitor 一个使用 Python 编写的系统监控工具，它可以监控 CPU、内存和磁盘的使用情况，并通过 Telegram 发送警告

Python GitHub

TeleMonitor 是一个使用 Python 编写的系统监控工具，它可以监控 CPU、内存和磁盘的使用情况，并通过 Telegram 发送警告。首先，你需要创建一个 Telegram bot，然后获取 API token。你可以参考 Telegram 官方文档来创建一个 Telegram bot。然后，你需要获取你希望接收警告的 Telegram chat ID。你可以使用 @userinfobot 来获取你的 chat ID。接下来 clone 这个项目： git clone https:

moments: 极简朋友圈

GitHub

支持匿名评论/点赞支持引入网易云音乐,b站视频,插入链接等支持自定义头图,个人头像,网站标题等支持上传图片到S3兼容的云存储,支持本地存储适配手机支持暗黑模式数据库采用sqlite,可随时备份支持引入豆瓣读书/豆瓣电影,样式来源于这里有其他需求欢迎提issues. 默认用户名密码:admin/a123456,登录进去后后台可以自己修改密码. 自定义其他配置鉴于萝卜青菜各有所爱,每个人情况不一致,特此使用配置文件配置各项特性化需求,目前支持以下环境变量配置见. 同时也支持使用配置文件的方

老胡的信息技术周刊

GitHub 计算机

老胡的信息周刊，每周记录老胡看到的有价值的信息，主要针对计算机领域，内容主题极大程度被老胡个人喜好主导。这个项目核心目的在于记录让自己有印象的信息做一个留存以及共享。已经坚持更新两年多，当前阅读渠道如下：网站 | RSS TG 频道 | 公众号今日推荐目前正在利用周刊收集的资源，为非极客用户群体打破信息不对称，减少信息差，这次项目计划名为：FRE123-Free Resource for Everyone 老胡的周刊开始于2021-08-16，如果你在看到这篇文章的时候，我依旧在更新，那么这就是

text2video: 半个神器👉一键文本转视频的工具

AI GitHub

一键文本转视频的工具可以将一段文本转换为视频，并保存到指定的本地，初衷是想实现小说的可视化阅读功能。实现原理将文本进行分段，现在没有想到好的办法，就是通过标点符号句号分段，分成一个个的句子通过句子生成图片，生成声音，图片开源的有很多，本方案采用 stable-diffusion，语言转文字使用 edge-tts 通过大模型生成midjourney类的提示词，然后通过huggingface的模型生成图片。在通过 opencv 将图片合并为视频，目前输出 mp4 格式的视频，句子作为字母贴到视频内容

HanLP 中文分词面向生产环境的前沿多语种自然语言处理技术

GitHub

中文分词将文本切分为独立语义单位。支持粗分、细分双重标准，高低优先级自定义词典，多语种词性标注给每个单词标注语法类别，支持多种词性标注集：CTB、PKU、863、UD、NPCMJ，多语种命名实体识别识别文本中的专有名词，支持多种规范：PKU、MSRA、OntoNotes，黑白名单词典、多语种依存句法分析分析单词语法上的依赖，支持多种句法体系：SD、UD、PMT，投射/非投射，多语种成分句法分析分析句子在语法上的递归构成，并将其表示为树形结构。支持可视化、多语种语义依存分析分析句子中

jieba: 结巴中文分词，做最好的 Python 中文分词组件

Python GitHub

结巴中文分词：做最好的 Python 中文分词组件结巴分词特点支持四种分词模式： 1，精确模式，试图将句子最精确地切开，适合文本分析； 2，全模式，把句子中所有的可以成词的词语都扫描出来, 速度非常快，但是不能解决歧义； 3，搜索引擎模式，在精确模式的基础上，对长词再次切分，提高召回率，适合用于搜索引擎分词。 4，paddle模式，利用PaddlePaddle深度学习框架，训练序列标注（双向GRU）网络模型实现分词。同时支持词性标注。paddle模式使用需安装paddlepaddle-tiny，pi

xz/liblzma 后门

开源项目 GitHub

2024年3月29日，一份关于在自由软件社区备受争议的开源项目 xz 软件包被上游源代码中的后门所污染的报告在 oss-security 邮件列表中曝光。这个后门影响到了 liblzma 库，它是 xz 软件包的一部分，在第一份报告发布后有多了很多跟进的研究，内容主要如下: 1）这个后门完整地存在于发布的 xz 源码包中(5.6.0 和 5.6.1 版本)，但上游 git 仓库中存在伪装为测试数据，但并未插入 liblzma 中的载荷，而打包前单独加入源码包中的唤醒代码（它们不存在于 git 仓库中

GitHub 代码自动修复工具

GitHub

GitHub 推出了代码自动修复工具 Code Scanning Autofix。该功能目前处于公测阶段，提供给 GitHub Advanced Security 客户，在其私有库上自动启用，能帮助处理 JavaScript、Typescript、Java 和 Python 中逾九成的警告类型。GitHub 称该功能在不怎么需要开发者编程的情况下修复逾三分之二发现的漏洞。GitHub 称，对于支持的语言中发现的漏洞，修复建议将包括建议修复的自然语言解释，以及开发者可接受、编辑或忽略的代码建议预览。软件公

bruno 无需登录、免费的 API 客户端，替换臃肿的Postman

GitHub Postman

Bruno 是一款仅限离线使用（无需登录）的 API 客户端桌面工具，可用来测试和请求 API。它不同于日益臃肿、同类型的 Postman 等工具，你可以直接在本地管理接口信息和数据，没有杂七杂八的账号管理、代理请求、云同步等功能，简单直接、开箱即用的 API 客户端，适用于 Windows、macOS 和 Linux 操作系统。 Bruno 是一款全新且创新的 API 客户端，旨在颠覆 Postman 和其他类似工具。 Bruno 直接在您的电脑文件夹中存储您的 API 信息。我们使用纯文本标记语言

ChatGPT-Plus: 使用官方 ChatGPT API 的应用程序

ChatGPT GitHub

ChatGPT-Plus 客户端是官方 ChatGPT API 的应用程序。该应用程序是对 OpenAI 的ChatGPT的官方 API 的封装应用。 ✨特性 📦 一个完整的 ChatGPT 客户端。 🚀 使用 Nextjs & Nestjs 构建，快速启动。 📱 响应式设计，支持移动端访问。 🌈 支持多种主题, 白天/夜间模式。 🌍 国际化支持，目前支持中文和英文。 📦 支持自定义提示词，查看在线推荐提示词 🎨 使用 CSS-in-JS 技术，支持主题定制。 📦 支持 Docker & Vercel

pypinyin 汉字拼音转换工具（Python 版）

Python GitHub

将汉字转为拼音。可以用于汉字注音、排序、检索(Russian translation) 。最初版本的代码参考了 hotoo/pinyin 的实现。特性根据词组智能匹配最正确的拼音。支持多音字。简单的繁体支持，注音支持，威妥玛拼音支持。支持多种不同拼音/注音风格。安装 pip install pypinyin 使用示例 >>> from pypinyin import pinyin, lazy_pinyin, Style >>> pinyin('中心') or pinyin(['中心'])，

OpenAI 开源 Transformer Debugger

OpenAI GitHub

OpenAI 开源了 Transformer Debugger 工具，该工具是由其 Superalignment 团队开发，用于支持对小语言模型特定行为的调查，组合了自动可解释性技术和稀疏自编码器。它可以用于回答“为什么模型对于这一提示输出了令牌 A 而不是令牌 B”之类的问题。Transformer Debugger 采用 MIT 许可证托管在 GitHub 上。OpenAI 之前曾被马斯克抨击不再共享和开源技术。

AppFlowy 一款基于Flutter开发的开源笔记工具

GitHub

一款基于Flutter开发的开源笔记工具，旨在适用于各种操作系统。其目标是成为Notion的替代品，提供强大的笔记和组织功能。AppFlowy采用现代化的技术，支持跨平台使用，为用户提供了灵活且高效的笔记体验。无论是个人学习、团队协作，还是项目管理，AppFlowy都致力于满足用户对优秀笔记工具的需求。

BCUninstaller：轻松卸载你不想要的应用

GitHUb 软件工具

今天的人们更多通过智能手机娱乐和获取信息，但电脑仍然是你必不可少的工作工具，你仍然会和十几年前的人一样遭遇各种垃圾软件。遇到不想要的软件卸载不掉怎么办？用 360 以毒攻毒？你其实可以用开源软件来帮助完成这项工作，今天推荐的就是其中的佼佼者：Bulk Crap Uninstaller，简写 BCUninstaller 或缩写 BCU。然安装时没有中文语言可选择，但安装过程中会自动添加中文语言包。和其它开源软件类似，它的界面有点复杂，但习惯之后也就一目了然了。右侧显示的是可卸载程序列表，有复选框可以同