MIT News 自动采集中译 + AI 总结
创建时间: 2026-04-01
难度: ⭐⭐⭐(需要配置翻译 API)
预计耗时: 40 分钟
前置要求: 完成第 1 篇(CSDN 采集)
状态: ✅ 完成
---
<## id="section-0">🎯 教学目标</##>
学完这篇,你将学会:
---
<## id="section-1">📋 场景介绍</##>
你是: 科技从业者/投资人/研究员
需求: 每天了解国际前沿科技动态
痛点:
解决方案:
最终效果:
每天早上 7:00,自动收到 MIT News 科技日报【AI 翻译 + 摘要】
1. 新型量子计算机突破 - 100 字摘要 - 原文链接
2. AI 医疗诊断新进展 - 100 字摘要 - 原文链接
...
无需阅读英文,3 分钟掌握全球科技前沿
---
<## id="section-2">🗺️ 完整流程</##>
第 1 步:采集 MIT News 首页
↓
第 2 步:提取新闻列表(标题 + 链接 + 日期)
↓
第 3 步:翻译标题为中文
↓
第 4 步:AI 生成摘要(每条 100 字)
↓
第 5 步:格式化输出(Markdown)
↓
第 6 步:保存到本地 + 发送通知
---
<## id="section-3">💬 关键指令(直接复制)</##>
<### id="section-4">完整指令模板</###>
你是一个科技新闻助手,帮我采集 MIT News 并翻译总结【采集目标】
• 网址:https://news.mit.edu/
• 内容:首页最新科技新闻
• 数量:最新 10 条【采集字段】
• 英文标题(原文)
• 新闻链接(完整 URL)
• 发布日期(YYYY-MM-DD)
• 新闻分类(如 AI、Quantum、Biotech 等)【翻译要求】
• 翻译标题为中文
• 保持专业术语准确性
• 音译人名/机构名(如"MIT"→"麻省理工")【摘要要求】
• 每条新闻生成 100 字中文摘要
• 突出核心创新点
• 说明技术突破/应用价值
• 避免过度技术细节【输出格式】
Markdown 格式,保存到本地文件:
MIT News 科技日报 - YYYY-MM-DD
<## id="section-5">📰 今日要闻##>
<### id="section-6">1. 【中文标题】###>
原文: [英文标题]
摘要: [100 字摘要]
分类: [分类]
链接: [原文链接]
日期: [发布日期]
<### id="section-7">2. 【中文标题】###>
...
【保存路径】
/Users/openclaw/Desktop/mit_news_YYYY-MM-DD.md
【开始采集】
请先访问 MIT News 首页,然后告诉我找到了多少条新闻
---
<## id="section-8">📝 使用说明</##>
<### id="section-9">1. 修改保存路径</###>
# 原路径
/Users/openclaw/Desktop/mit_news_YYYY-MM-DD.md改为你的路径
/Users/openclaw/Downloads/mit_news_YYYY-MM-DD.md
或
D:/mit_news_YYYY-MM-DD.md # Windows
<### id="section-10">2. 配置翻译 API(可选)</###>
使用阿里百炼翻译 MCP:
# 调用方式
mcporter call WebSearch.translate text="英文标题" target_lang="zh"或在指令中说明
"使用阿里百炼翻译 API 翻译标题"
<### id="section-11">3. 设置定时任务</###>
Cron 表达式(每天 7:00):
0 7 * cd /Users/openclaw/Desktop/workScript && python3 mit_news_collector.py
---
<## id="section-12">🔍 常见问题</##>
<### id="section-13">问题 1:翻译不准确</###>
现象: 专业术语翻译错误
解决:
在指令中强调:
"保持专业术语准确性,不确定的术语保留英文"
"音译人名和机构名"
<### id="section-14">问题 2:摘要太长</###>
现象: 摘要超过 200 字
解决:
在指令中强调:
"每条摘要严格控制在 100 字以内"
"只说明核心创新点,省略技术细节"
<### id="section-15">问题 3:采集失败</###>
现象: 无法访问 MIT News
解决:
---
<## id="section-16">✅ 验证清单</##>
采集完成后,检查结果:
---
<## id="section-17">📊 示例输出</##>
# MIT News 科技日报 - 2026-04-01<## id="section-5">📰 今日要闻##>
<### id="section-19">1. 新型量子计算机实现 1000 量子比特突破###>
原文: New quantum computer achieves 1000-qubit milestone
摘要: 麻省理工研究人员开发出新型量子处理器,成功实现 1000 个量子比特的稳定运行。相比现有技术方案,错误率降低 90%,为大规模量子计算应用奠定基础。该技术可用于药物研发、材料科学等领域。
分类: Quantum Computing
链接: https://news.mit.edu/2026/quantum-computer-milestone
日期: 2026-04-01
<### id="section-20">2. AI 系统可提前 6 个月预测阿尔茨海默病###>
原文: AI system predicts Alzheimer's 6 months earlier
摘要: 研究团队训练出新型 AI 诊断模型,通过分析脑部扫描图像,可在症状出现前 6 个月预测阿尔茨海默病风险。准确率达 94%,有望实现早期干预治疗。该技术已在三家医院开展临床试验。
分类: AI + Healthcare
链接: https://news.mit.edu/2026/ai-alzheimers-prediction
日期: 2026-04-01
---
<## id="section-21">🎯 进阶技巧</##>
<### id="section-22">1. 多源采集</###>
同时采集多个科技新闻源:
指令:
"同时采集 MIT News 和 Stanford News 的最新科技新闻
每个来源采集 5 条,共 10 条
合并输出,标注来源"
<### id="section-23">2. 个性化筛选</###>
根据兴趣筛选新闻:
指令:
"只采集以下分类的新闻:
• 人工智能(AI)
• 量子计算(Quantum)
• 生物技术(Biotech)跳过其他分类"
<### id="section-24">3. 自动发送</###>
采集后自动发送到通知渠道:
指令:
"采集完成后,自动发送到:
1. 邮箱:your-email@example.com
2. 企业微信:Webhook URL邮件主题:MIT News 科技日报 - YYYY-MM-DD
"
---
<## id="section-25">📚 相关资源</##>
---
下一篇: 实战篇第 4 篇:知乎热门问题自动采集 + 高质量回答筛选
小 B 🔥
2026-04-01
---
文件位置: `/Users/openclaw/Desktop/workScript/html/ocnote/content/crawler/08-practice-mit-news-auto-translate.md`