zjrwtx

Follow

🎯

Focusing

Yifeng Wang（正经人王同学） zjrwtx

🎯

Focusing

Follow

wechat：whatisallineed github：https://github.com/zjrwtx email：[email protected]

59 followers · 0 following

zjrwtx/README.md

🌟 Hello World, I'm Yifeng Wang

AIsyntheticdata Researcher & AI Developer

微信公众号:正经人王同学知乎:正经人王同学微信：whatisallineed

🎯 关于我 | About Me

"less is more"

🔭 正在从事多模态数据合成、reasoning model、multi agent、超长上下文、RL scaling的研究
🌱 是个ENTJ水瓶座的大四在读医学生

💻 技术栈 | Tech Stack

🤖 全栈开发技术栈

jupyter、python（flask、fastapi）、golang、react、tailwindcss、typescript、vite、uniapp、taro、git、docker、k8s......

🤖 AI技术栈

pytorch、huggingface、multi-agent、posttraining、data generation、reasoning model、long contenxt memory、RL scaling......

🚀 重点项目 | Featured Projects

🤖 捕获月球大模型数据合成、处理、筛选系列（待整合成一体化的低耦合系统）

SFT训练数据构建工具

视频问答数据集构建

大模型RLHF（ppo奖励模型）训练偏好数据排序助手（支持ollama本地模型）

视频转图文并茂的pdf—loopytransform：打工人（会议记录）和学生党（网课笔记）等必备！

多模态数据工厂

🎯 AI 应用

全球首个开源且用于医院检验科的企业级生产级AI大模型Agent系统

全球首个用于医院检验科的企业级开源AI机器人解决方案

基于零一万物等AI视觉大模型简单几步就能批量生成Anki图片笔记

不挂科AI前端：这是一个基于React的Web应用程序，为学生们提供各种AI驱动的功能，如题目生成、试卷生成、思维导图生成、视频转PDF、笔记生成、社区分享等。该应用程序旨在帮助学生更有效地学习和准备考试。

不挂科AI后端：不挂科AI后端是一个基于FastAPI框架构建的Web应用程序，旨在为用户提供一系列智能化的服务，包括视频转PPT、PPT转PDF、PDF和PPT内容解析、考试重点大纲生成、出题、思维导图生成等功能。该后端服务使用了多种Python库，如FastAPI、PyPDF2、python-pptx、sqlalchemy、pydantic、passlib、python-jose、python-dotenv、requests、pymysql、scikit-image、opencv-python、imutils和img2pdf等

Yourmemory：这是一个基于 React 的 Web 应用程序，旨在帮助用户记录和记住他们的记忆。用户可以通过与 AI 助手进行对话来分享他们的记忆，并获取有关如何更好地管理和组织记忆的建议。功能用户可以与 AI 助手进行对话，分享他们的记忆。 AI 助手会根据用户的输入提供个性化的建议和反馈。用户可以添加新的任务和标签，以便更好地管理和组织他们的记忆。应用程序支持深色模式和浅色模式，以满足用户的不同需求。

📊 GitHub 统计 | Statistics

🌐 社交媒体 | Social Media

💬 微信公众号：正经人王同学
📱 微信：whatisallineed
🐦 Twitter：@zjrwtx
📫 邮箱：[email protected]

📈 贡献时间线 | Contribution Timeline

💡 "less is more"

Pinned Loading

Yijian-Agent Yijian-Agent Public

全球首个开源且用于医院检验科的企业级生产级的AI大模型agent系统||助力全面提升检验效率、检验准确性、检验复杂问题分析能力、检验领域科研发现水平等

Python 4
SFT-data-builder SFT-data-builder Public

利用免费的大模型api来结合你的私域数据来生成sft训练数据（妥妥白嫖）支持llamafactory等工具的训练数据格式synthetic data

JavaScript 119 9
AIgene_anki AIgene_anki Public

基于零一万物等AI视觉大模型简单几步就能批量生成Anki图片笔记

Python 31 2
literesearch_search literesearch_search Public

LiteSearch Research A modern, efficient research tool that allows you to perform simultaneous searches across multiple search engines and academic databases. Built with React, TypeScript, and Tailw…

TypeScript 1
videotopdf_ui videotopdf_ui Public

视频转图文并茂的pdf—videotopdf：打工人（会议记录）和学生党（网课笔记）等必备！使用地址：https://zjrwtxtechstudio-video-to-pdf.hf.space

Python 33 5
VideoQA_databuilder VideoQA_databuilder Public

基于youtube、bilibili等视频平台、webpage网页等，利用零一万物大模型或ollama本地小模型构建大语言模型高质量训练数据集（计划支持可自定义输出的训练数据格式）

Python 17 2