+ 我要发布
我发布的 我的标签 发现
公开标签 #GitHUb
在线批量导出微信公众号文章,支持内嵌的音视频导出,无需搭建任何环境,可100%还原文章样式,支持私有部署。特点搜索公众号,支持关键字和biz搜索搜索公众号内文章(根据文章标题搜索)导出 html 格式(打包了图片和样式文件,能够保证100%还原文章样式)批量导出 html 格式(zip打包)缓存文章列表数据,减少接口请求次数 (关键字搜索的文章不会进入缓存)支持文章过滤,包括作者、标题、发布时间、原创标识、所属合集等支持合集下载支持内嵌的音视频下载支持图片分享消息支持视频分享消息支持导出评论、阅读量等数
网站流量统计分析对于网站运营者来说至关重要。许多公共统计工具如Google Analytics虽然功能强大,但在国内访问速度较慢,还存在隐私泄露的风险。寻找一款轻量级、对用户隐私友好的开源自建统计工具显得尤为重要。本文将为大家推荐5款优秀的开源自建网站流量统计分析工具。1. UmamiUmami是一款简单易用、自托管的开源网站访问统计分析工具。它不使用Cookie,不跟踪用户,且所有收集的数据都会进行匿名化处理,符合GDPR标准。Umami的资源占用很低,功能虽然简单,但分析的数据内容却很丰富,包括来源
NotionNext使用 NextJS Notion API 实现的,支持多种部署方案的静态博客,无需服务器、零门槛搭建网站,为Notion和所有创作者设计。 NotionNext的愿景是帮助非技术人员的小白,最低成本、最快速地搭建自己的网站,帮助您将自己的产品与故事高效地传达给世界。 功能强大的Notion笔记,简单快速的Vercel托管平台,组成一个简单的网站。
一款轻量的阅读软件,目前仅支持ePub格式电子书。 特点 页面干净,计算机资源占用低 阅读进度记忆 完全本地 滚动化阅读,让阅读连续 Windows、MacOS、Ubuntu多平台支持 支持多种明、暗主题,支持自定义主题 限制 仅适用于DRM-free ePub 电子书 不适用于每页都是图片的电子书 注意事项 部分包含数学公式的电子书使用图片显示公式,暗色主题下可能无法看清 少数ePub电子书制作不完全规范,章节显示会有问题。 部分操作结束后可能需要使用左上第4个按钮刷新重新加载
微软研究团队开发的一款开源项目,专注于利用深度学习技术修复老旧照片,包括去除划痕、提高照片清晰度和色彩效果。 Bringing-Old-Photos-Back-to-Life 开源地址:https://github.com/microsoft/Bringing-Old-Photos-Back-to-Life 该项目的基本原理是使用变分自动编码机(VAE)将旧照片和干净照片分别编码到两个潜在空间,然后通过合成数据学习两个潜在空间之间的转换,从而实现对真实照片的修复。 Colab 体验地址:https://
Album AI 是一个试验项目,使用刚刚发布的gpt-4o-mini和 Haiku 作为廉价的视觉模型,自动识别出相册中图像文件的元信息,然后借助RAG技术,实现了与相册对话的能力。 可以当做传统的相册使用,也可以作为一个图像知识库辅助LLM生成内容。 自动发现相册中的图片,使用一个 PgSQL 数据库存储 使用GPT-4-o-mini,自动生成图像的元信息 使用OpenAI的Embedding API,完成元信息向量化 提供两个API: Search: 传统的Search API,输入query,返
使用加速度计的深蹲计数器。健康是一切的本钱,深蹲有益健康,本项目用纯Web实现了一个深蹲计数器,通过读取设备的加速度计,进而实现深蹲计数。 直接在浏览器打开以上网址即可,如果显示需要授权,就点一下授权按钮,这样程序就会获取加速度传感器的权限,进行计数。 程序小而美,打开网页后,不需要任何操作,只需将屏幕面向自己,做深蹲动作,计数即可自动增加。 开元地址:https://github.com/zhaoolee/Sport
code-box可以用于CSDN/知乎/脚本之家/博客园等网站,实现无需登录一键复制代码,支持选中代码,或者代码右上角按钮的一键复制,解除关注博主即可阅读全文提示,去除登录弹窗,去除跳转APP弹窗。 进入浏览器应用商店搜索codebox(支持Chrome、Firefox、Edge应用商店) Chrome扩展商店:https://chrome.google.com/webstore/detail/acnnhjllgegbndgknlliobjlekgilbdf Firefox扩展商店:https://ad
使用简单 AList 从一开始就设计为易于安装,并且可以在所有平台上使用。 多种存储 AList 支持多个存储提供商,包括本地存储、阿里云盘、OneDrive、Google Drive 等,且易于拓展。 支持 WebDAV AList 支持所有 WebDAV 存储,这是一种用于访问文件的标准。 黑暗模式 自由切换明暗模式 受保护的路由 为特定路径添加密码保护和身份验证 文件预览 支持视频、音频、文档、PDF、图片预览等,甚至支持 ipa 安装 打包下载/批量下载 使用浏览器的 stream api 支持
目前已经支持的消息类型 模板消息-公众号 模板消息-小程序 订阅消息-小程序 微信客服消息 微信企业号/企业微信消息 小程序统一服务消息 钉钉 阿里云短信 阿里大于模板短信 腾讯云短信 华为云短信 百度云短信 又拍云短信 七牛云短信 云片网短信 E-Mail HTTP请求(单次、批量、压测) 计划中支持的消息类型 网易云信短信 榛子云短信 Luosimao短信 极光短信 极光推送 功能&亮点 支持自定义消息内容并批量推送 支持变量消息(可实现根据发送目标用户不同每条消息内容不一样) 支持消息编辑、预览、
2022年底,ChatGPT 震撼上线,大语言模型技术迅速“席卷”了整个社会,人工智能技术因此迎来了一次重要进展。面对大语言模型的强大性能,我们不禁要问:支撑这些模型的背后技术究竟是什么?这一问题无疑成为了众多科研人员的思考焦点。 必须指出的是,大模型技术并不是一蹴而就,其发展历程中先后经历了统计语言模型、神经网络语言模型、预训练语言模型等多个发展阶段,每一步的发展都凝结了众多科研工作者的心血与成果。作为大语言模型技术的重要推动者,OpenAI公司在过去深入探索了与其相关的大量技术细节,并最终推出了GP
Ollama是一个开源的项目,设计用于简化大模型(LLM)的部署和使用流程。它允许用户下载并本地运行像 Llama 3、Code Llama、Gemma、Mistral 等大模型,并支持自定义和创建自己的大模型。 Ollama支持 macOS 、Linux 操作系统和 Windows preview。此外 Ollama还提供了官方的 Docker 镜像,使得使用 Docker 容器部署大模型变得更加简单。Ollama 支持 GPU 加速,并提供了简单的命令行界面(CLI)以及用于与应用程序交互的 RES
广告滚蛋 / OFGB 的界面非常非常简单,打开后就是一个让你“打钩钩”的列表,选择需要禁用/关闭的系统广告,确定之后,重启电脑即可生效。使用上没有任何一丝的难度,适合广大电脑小白使用。 OFGB 体积非常小巧,仅一百多 KB,而且还能同时支持 x64 (64位) 和 ARM 架构的电脑,使用 Windows 11 ARM 的同学也可以使用。不过他需要系统安装 .Net 8.0 Desktop Runtime 运行库才能正常运行。 .Net 8.0 Desktop Runtime 运行库下载地址: ht
Douyin_TikTok_Download_API 是一个开箱即用的高性能异步抖音、快手、TikTok、Bilibili数据爬取工具,支持API调用,在线批量解析及下载。 本项目是基于 PyWebIO,FastAPI,HTTPX,快速异步的抖音/TikTok数据爬取工具,并通过Web端实现在线批量解析以及下载无水印视频或图集,数据爬取API,iOS快捷指令无水印下载等功能。你可以自己部署或改造本项目实现更多功能,也可以在你的项目中直接调用scraper.py或安装现有的pip包作为解析库轻松爬取数据。
日本的一个研究小组发布了Fugaku-LLM,一个大型语言模型(1)具有增强的日语能力,使用RIKEN超级计算机Fugaku。该团队由东京工业大学的Rio Yokota教授、东北大学的Keisuke Sakaguchi副教授、富士通株式会社的Koichi Shirahata、RIKEN的Mohamed Wahib团队负责人、名古屋大学的Koji Nishiguchi副教授、CyberAgent, Inc的Shota Sasaki和Kotoba Technologies Inc.的Noriyuki Koj
ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型,基于 General Language Model (GLM) 架构,具有 62 亿参数。结合模型量化技术,用户可以在消费级的显卡上进行本地部署(INT4 量化级别下最低只需 6GB 显存)。 ChatGLM-6B 使用了和 ChatGPT 相似的技术,针对中文问答和对话进行了优化。经过约 1T 标识符的中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术的加持,62 亿参数的 ChatGLM-6B 已经能生成相当符合人类偏好的回答
GitHub 发布了 2023 年平台上使用最多的编程语言,排名前十的分别是:JavaScript、Python TypeScript、Java、C#、C++、PHP、C、Shell、Go。 JavaScript 依然稳居最常用编程语言的宝座,并且在 Web 开发领域发挥着核心作用。JavaScript 作为客户端脚本语言,它使得网页能够执行动态内容的生成,从而提供更加丰富和交互的用户体验。全球企业普遍采用 JavaScript 来构建 Web 应用程序,得益于 Vue、React 和 Angular
TeleMonitor 是一个使用 Python 编写的系统监控工具,它可以监控 CPU、内存和磁盘的使用情况,并通过 Telegram 发送警告。 首先,你需要创建一个 Telegram bot,然后获取 API token。你可以参考 Telegram 官方文档 来创建一个 Telegram bot。 然后,你需要获取你希望接收警告的 Telegram chat ID。你可以使用 @userinfobot 来获取你的 chat ID。 接下来 clone 这个项目: git clone https:
支持匿名评论/点赞 支持引入网易云音乐,b站视频,插入链接等 支持自定义头图,个人头像,网站标题等 支持上传图片到S3兼容的云存储,支持本地存储 适配手机 支持暗黑模式 数据库采用sqlite,可随时备份 支持引入豆瓣读书/豆瓣电影,样式来源于这里 有其他需求欢迎提issues. 默认用户名密码:admin/a123456,登录进去后后台可以自己修改密码. 自定义其他配置 鉴于萝卜青菜各有所爱,每个人情况不一致,特此使用配置文件配置各项特性化需求,目前支持以下环境变量配置见. 同时也支持使用配置文件的方
老胡的信息周刊,每周记录老胡看到的有价值的信息,主要针对计算机领域,内容主题极大程度被老胡个人喜好主导。这个项目核心目的在于记录让自己有印象的信息做一个留存以及共享。 已经坚持更新两年多,当前阅读渠道如下: 网站 | RSS TG 频道 | 公众号 今日推荐 目前正在利用周刊收集的资源,为非极客用户群体打破信息不对称,减少信息差,这次项目计划名为:FRE123-Free Resource for Everyone 老胡的周刊开始于2021-08-16,如果你在看到这篇文章的时候,我依旧在更新,那么这就是
一键文本转视频的工具可以将一段文本转换为视频,并保存到指定的本地,初衷是想实现小说的可视化阅读功能。 实现原理 将文本进行分段,现在没有想到好的办法,就是通过标点符号句号分段,分成一个个的句子 通过句子生成图片,生成声音,图片开源的有很多,本方案采用 stable-diffusion,语言转文字使用 edge-tts 通过大模型生成midjourney类的提示词,然后通过huggingface的模型生成图片。 在通过 opencv 将图片合并为视频,目前输出 mp4 格式的视频,句子作为字母贴到视频内容
中文分词 将文本切分为独立语义单位。支持粗分、细分双重标准,高低优先级自定义词典,多语种 词性标注 给每个单词标注语法类别,支持多种词性标注集:CTB、PKU、863、UD、NPCMJ,多语种 命名实体识别 识别文本中的专有名词,支持多种规范:PKU、MSRA、OntoNotes,黑白名单词典、多语种 依存句法分析 分析单词语法上的依赖,支持多种句法体系:SD、UD、PMT,投射/非投射,多语种 成分句法分析 分析句子在语法上的递归构成,并将其表示为树形结构。支持可视化、多语种 语义依存分析 分析句子中
结巴中文分词:做最好的 Python 中文分词组件 结巴分词特点 支持四种分词模式: 1,精确模式,试图将句子最精确地切开,适合文本分析; 2,全模式,把句子中所有的可以成词的词语都扫描出来, 速度非常快,但是不能解决歧义; 3,搜索引擎模式,在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词。 4,paddle模式,利用PaddlePaddle深度学习框架,训练序列标注(双向GRU)网络模型实现分词。同时支持词性标注。paddle模式使用需安装paddlepaddle-tiny,pi
2024年3月29日,一份关于在自由软件社区备受争议的开源项目 xz 软件包被上游源代码中的后门所污染的报告在 oss-security 邮件列表中曝光。 这个后门影响到了 liblzma 库,它是 xz 软件包的一部分,在第一份报告发布后有多了很多跟进的研究,内容主要如下: 1) 这个后门完整地存在于发布的 xz 源码包中(5.6.0 和 5.6.1 版本),但上游 git 仓库中存在伪装为测试数据,但并未插入 liblzma 中的载荷,而打包前单独加入源码包中的唤醒代码(它们不存在于 git 仓库中