auto-paper-digest

auto-paper-digest

auto-paper-digest: An automated pipeline that tracks Hugging Face weekly AI papers, downloads PDFs, imports them into NotebookLM, generates video overviews, and archives everything into a searchable weekly digest.

Stars: 485

Visit
 screenshot

Auto Paper Digest (APD) is a tool designed to automatically fetch cutting-edge AI research papers, download PDFs, generate video explanations, and publish them on platforms like HuggingFace, Douyin, and portal websites. It provides functionalities such as fetching papers from Hugging Face, downloading PDFs from arXiv, generating videos using NotebookLM, automatic publishing to HuggingFace Dataset, automatic publishing to Douyin, and hosting videos on a Gradio portal website. The tool also supports resuming interrupted tasks, persistent login states for Google and Douyin, and a structured workflow divided into three phases: Upload, Download, and Publish.

README:

๐Ÿš€ Auto Paper Digest (APD)

่‡ชๅŠจ่Žทๅ– AI ๅ‰ๆฒฟ่ฎบๆ–‡ โ†’ ไธ‹่ฝฝ PDF โ†’ ็”Ÿๆˆ่ง†้ข‘่ฎฒ่งฃ โ†’ ๅ‘ๅธƒๅˆฐ HuggingFace/ๆŠ–้Ÿณ โ†’ ้—จๆˆท็ฝ‘็ซ™ๅฑ•็คบ

Python NotebookLM HuggingFace Douyin License

๐ŸŽฅ ๅœจ็บฟไฝ“้ชŒ๏ผš https://huggingface.co/spaces/brianxiadong0627/paper-digest


๐Ÿ“ฑ ๅ…ณๆณจๆŠ–้Ÿณ๏ผŒ่Žทๅ–ๆœ€ๆ–ฐ AI ่ฎบๆ–‡่งฃ่ฏป่ง†้ข‘๏ผ

ๆŠ–้ŸณไบŒ็ปด็ 

๐Ÿ”ฅ ๆœ€ๆ–ฐAI่ฎบๆ–‡๏ผŒๆฏๅ‘จๆ›ดๆ–ฐ
ๆ‰ซ็ ๅ…ณๆณจ๏ผŒ็ฌฌไธ€ๆ—ถ้—ด่Žทๅ–็ฒพๅฝฉๅ†…ๅฎน


โœจ ๅŠŸ่ƒฝไบฎ็‚น

ๅŠŸ่ƒฝ ่ฏดๆ˜Ž
๐Ÿ“š ่ฎบๆ–‡่Žทๅ– ่‡ชๅŠจๆŠ“ๅ– Hugging Face ๆฏๅ‘จ็ƒญ้—จ AI ่ฎบๆ–‡๏ผˆๆ”ฏๆŒๅ‘จ URL๏ผ‰
๐Ÿ“„ PDF ไธ‹่ฝฝ ไปŽ arXiv ไธ‹่ฝฝ่ฎบๆ–‡ PDF๏ผˆๅน‚็ญ‰ๆ“ไฝœ๏ผŒSHA256 ๆ ก้ชŒ๏ผ‰
๐ŸŽฌ ่ง†้ข‘็”Ÿๆˆ ้€š่ฟ‡ NotebookLM ่‡ชๅŠจ็”Ÿๆˆ่ฎบๆ–‡่ง†้ข‘่ฎฒ่งฃ
๐Ÿ“ค ่‡ชๅŠจๅ‘ๅธƒ ไธŠไผ ่ง†้ข‘ๅˆฐ HuggingFace Dataset
๐Ÿ“ฑ ๆŠ–้Ÿณๅ‘ๅธƒ ่‡ชๅŠจๅ‘ๅธƒ่ง†้ข‘ๅˆฐๆŠ–้Ÿณๅˆ›ไฝœ่€…ๅนณๅฐ
๐ŸŒ ้—จๆˆท็ฝ‘็ซ™ Gradio ้—จๆˆท็ฝ‘็ซ™๏ผŒๅœจ็บฟๆ’ญๆ”พ่ง†้ข‘
๐Ÿ’พ ๆ–ญ็‚น็ปญไผ  SQLite ็Šถๆ€่ฟฝ่ธช๏ผŒๆ”ฏๆŒไธญๆ–ญๅŽ็ปง็ปญ
๐Ÿ” ็™ปๅฝ•ๅค็”จ Google/ๆŠ–้Ÿณ็™ปๅฝ•็Šถๆ€ๆŒไน…ๅŒ–๏ผŒไธ€ๆฌก็™ปๅฝ•้•ฟๆœŸไฝฟ็”จ

๐Ÿ“ ๆžถๆž„่ฎพ่ฎก

โ”Œโ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”
โ”‚                        Auto Paper Digest                             โ”‚
โ”œโ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”ค
โ”‚                                                                      โ”‚
โ”‚   Phase 1: Upload            Phase 2: Download      Phase 3: Publish โ”‚
โ”‚   โ”Œโ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”    โ”Œโ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”    โ”Œโ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”    โ”Œโ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ” โ”‚
โ”‚   โ”‚   HF    โ”‚โ”€โ”€โ”€โ–ถโ”‚  arXiv  โ”‚โ”€โ”€โ”€โ–ถโ”‚ NotebookLM  โ”‚โ”€โ”€โ”€โ–ถโ”‚  HuggingFace โ”‚ โ”‚
โ”‚   โ”‚ Papers  โ”‚    โ”‚  PDFs   โ”‚    โ”‚   Videos    โ”‚    โ”‚   Dataset    โ”‚ โ”‚
โ”‚   โ””โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”˜    โ””โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”˜    โ””โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”˜    โ””โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”˜ โ”‚
โ”‚        โ”‚               โ”‚               โ”‚                   โ”‚         โ”‚
โ”‚        โ–ผ               โ–ผ               โ–ผ                   โ–ผ         โ”‚
โ”‚   โ”Œโ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”   โ”‚
โ”‚   โ”‚                    SQLite Database                           โ”‚   โ”‚
โ”‚   โ”‚      (status: NEW โ†’ PDF_OK โ†’ NBLM_OK โ†’ VIDEO_OK)            โ”‚   โ”‚
โ”‚   โ””โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”˜   โ”‚
โ”‚                              โ”‚                                       โ”‚
โ”‚              โ”Œโ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”ผโ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”                       โ”‚
โ”‚              โ–ผ               โ–ผ               โ–ผ                       โ”‚
โ”‚   โ”Œโ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ” โ”Œโ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ” โ”Œโ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”               โ”‚
โ”‚   โ”‚ Portal Website  โ”‚ โ”‚   Douyin    โ”‚ โ”‚   Other     โ”‚               โ”‚
โ”‚   โ”‚  (HF Spaces)    โ”‚ โ”‚  Creator    โ”‚ โ”‚  Platforms  โ”‚               โ”‚
โ”‚   โ””โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”˜ โ””โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”˜ โ””โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”˜               โ”‚
โ”‚                                                                      โ”‚
โ””โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”˜

๐Ÿš€ ๅฟซ้€Ÿๅผ€ๅง‹

1. ๅฎ‰่ฃ…

# ๅ…‹้š†ไป“ๅบ“
git clone https://github.com/brianxiadong/auto-paper-digest.git
cd auto-paper-digest

# ๅฎ‰่ฃ…ไพ่ต–
pip install -e .

# ๅฎ‰่ฃ…ๆต่งˆๅ™จ
playwright install chromium

2. ้…็ฝฎ็Žฏๅขƒๅ˜้‡

# ๅคๅˆถ้…็ฝฎๆจกๆฟ
cp .env.example .env

# ็ผ–่พ‘ .env ๅกซๅ…ฅ HuggingFace ้…็ฝฎ
# HF_TOKEN=hf_xxx
# HF_USERNAME=your-username
# HF_DATASET_NAME=paper-digest-videos

3. ้ฆ–ๆฌก็™ปๅฝ• Google

apd login

ๆต่งˆๅ™จไผšๆ‰“ๅผ€ NotebookLM ็™ปๅฝ•้กต้ข๏ผŒๅฎŒๆˆ Google ็™ปๅฝ•ๅŽ๏ผŒไผš่ฏๅฐ†่ขซไฟๅญ˜ใ€‚


๐Ÿ“– ไธ‰้˜ถๆฎตๅทฅไฝœๆต

Phase 1: ไธŠไผ ๅนถ่งฆๅ‘่ง†้ข‘็”Ÿๆˆ

apd upload --week 2026-01 --headful --max 10

่ฏฅๅ‘ฝไปคไผš๏ผš

  • โœ… ่Žทๅ– HuggingFace ๆœฌๅ‘จ่ฎบๆ–‡๏ผˆไฝฟ็”จ /week/YYYY-WXX URL๏ผ‰
  • โœ… ไธ‹่ฝฝ arXiv PDF๏ผˆๆ”ฏๆŒ็ผ“ๅญ˜๏ผŒๅทฒไธ‹่ฝฝ็š„่ทณ่ฟ‡๏ผ‰
  • โœ… ไธŠไผ ๅˆฐ NotebookLM
  • โœ… ่งฆๅ‘่ง†้ข‘็”Ÿๆˆ๏ผˆไธ็ญ‰ๅพ…ๅฎŒๆˆ๏ผ‰

Phase 2: ไธ‹่ฝฝ็”Ÿๆˆ็š„่ง†้ข‘

็ญ‰ๅพ…ๅ‡ ๅˆ†้’ŸๅŽ๏ผˆ่ง†้ข‘็”Ÿๆˆ้œ€่ฆๆ—ถ้—ด๏ผ‰๏ผŒ่ฟ่กŒ๏ผš

apd download-video --week 2026-01 --headful

ๆ”ฏๆŒ็ผ“ๅญ˜๏ผๅทฒไธ‹่ฝฝ็š„่ง†้ข‘ไผš่‡ชๅŠจ่ทณ่ฟ‡๏ผŒไฝฟ็”จ --force ๅผบๅˆถ้‡ๆ–ฐไธ‹่ฝฝใ€‚

Phase 3: ๅ‘ๅธƒๅˆฐ HuggingFace

apd publish --week 2026-01

่ฏฅๅ‘ฝไปคไผš๏ผš

  • โœ… ไธŠไผ ่ง†้ข‘ๅˆฐ HuggingFace Dataset
  • โœ… ๆ›ดๆ–ฐ metadata.json
  • โœ… ็”Ÿๆˆ Markdown ๆ‘˜่ฆ

Phase 3b: ๅ‘ๅธƒๅˆฐๆŠ–้Ÿณ๏ผˆๅฏ้€‰๏ผ‰

้ฆ–ๆฌกไฝฟ็”จ้œ€่ฆๅ…ˆ็™ปๅฝ•ๆŠ–้Ÿณ๏ผš

apd douyin-login

ๆต่งˆๅ™จไผšๆ‰“ๅผ€ๆŠ–้Ÿณๅˆ›ไฝœ่€…ไธญๅฟƒ็™ปๅฝ•้กต้ข๏ผŒไฝฟ็”จๆŠ–้Ÿณ APP ๆ‰ซ็ ็™ปๅฝ•๏ผŒ็™ปๅฝ•็Šถๆ€ๅฐ†่ขซไฟๅญ˜ใ€‚

็„ถๅŽๅ‘ๅธƒ่ง†้ข‘ๅˆฐๆŠ–้Ÿณ๏ผš

apd publish-douyin --week 2026-01 --headful

่ฏฅๅ‘ฝไปคไผš๏ผš

  • โœ… ่‡ชๅŠจไธŠไผ ่ง†้ข‘ๅˆฐๆŠ–้Ÿณๅˆ›ไฝœ่€…ๅนณๅฐ
  • โœ… ๅกซๅ†™่ง†้ข‘ๆ ‡้ข˜๏ผˆ่ฎบๆ–‡ๆ ‡้ข˜๏ผ‰
  • โœ… ๆทปๅŠ ่ฏ้ข˜ๆ ‡็ญพ๏ผˆAIใ€่ฎบๆ–‡่งฃ่ฏป็ญ‰๏ผ‰
  • โœ… ่‡ชๅŠจ็‚นๅ‡ปๅ‘ๅธƒ

๐Ÿ’ก ๆ็คบ๏ผš้ฆ–ๆฌกไฝฟ็”จๅปบ่ฎฎๆทปๅŠ  --headful ๅ‚ๆ•ฐ่ง‚ๅฏŸๅ‘ๅธƒ่ฟ‡็จ‹๏ผŒ็กฎ่ฎคๆ— ่ฏฏๅŽๅฏๅŽปๆމ่ฏฅๅ‚ๆ•ฐใ€‚


๐Ÿ“… ๆŒ‰ๆ—ฅๅค„็†๏ผˆๅฏ้€‰๏ผ‰

้™คไบ†ๆŒ‰ๅ‘จๅค„็†ๅค–๏ผŒไนŸๆ”ฏๆŒๆŒ‰ๆ—ฅๆœŸๅค„็†่ฎบๆ–‡๏ผš

# ่Žทๅ–ๆŒ‡ๅฎšๆ—ฅๆœŸ็š„่ฎบๆ–‡
apd fetch --date 2026-01-08 --max 10

# ไธŠไผ ๅนถ็”Ÿๆˆ่ง†้ข‘
apd upload --date 2026-01-08 --headful --max 10

# ไธ‹่ฝฝ่ง†้ข‘
apd download-video --date 2026-01-08 --headful

# ๅ‘ๅธƒๅˆฐๆŠ–้Ÿณ
apd publish-douyin --date 2026-01-08 --headful

โš ๏ธ ๆณจๆ„๏ผšๅ‘จๆœซๅ’Œ่Š‚ๅ‡ๆ—ฅๆฒกๆœ‰่ฎบๆ–‡๏ผŒ็ณป็ปŸไผšๆ็คบ้”™่ฏฏ่€Œ้ž็ปง็ปญๅค„็†ใ€‚

ๆ–‡ไปถๅคน็ป“ๆž„

ๆŒ‰ๆ—ฅๅ’ŒๆŒ‰ๅ‘จ็š„ๆ•ฐๆฎๅˆ†ๅผ€ๅญ˜ๆ”พ๏ผš

  • data/pdfs/weekly/2026-01/ - ๆŒ‰ๅ‘จๅค„็†็š„ PDF
  • data/pdfs/daily/2026-01-08/ - ๆŒ‰ๆ—ฅๅค„็†็š„ PDF
  • data/videos/weekly/2026-01/ - ๆŒ‰ๅ‘จๅค„็†็š„่ง†้ข‘
  • data/videos/daily/2026-01-08/ - ๆŒ‰ๆ—ฅๅค„็†็š„่ง†้ข‘

๐ŸŒ ้—จๆˆท็ฝ‘็ซ™

่ง†้ข‘ๅ‘ๅธƒๅŽ๏ผŒๅฏๅœจ HuggingFace Spaces ้—จๆˆท็ฝ‘็ซ™็›ดๆŽฅ่ง‚็œ‹๏ผš

https://huggingface.co/spaces/your-username/paper-digest

๐Ÿ“– ๅ‘ฝไปคๅคงๅ…จ

ๅ‘ฝไปค ่ฏดๆ˜Ž
apd login ๆ‰“ๅผ€ๆต่งˆๅ™จๅฎŒๆˆ Google ็™ปๅฝ•๏ผˆNotebookLM๏ผ‰
apd douyin-login ๆ‰“ๅผ€ๆต่งˆๅ™จๅฎŒๆˆๆŠ–้Ÿณ็™ปๅฝ•
apd fetch ไป…่Žทๅ–่ฎบๆ–‡ๅˆ—่กจ๏ผˆไธไธ‹่ฝฝ๏ผ‰
apd download ไป…ไธ‹่ฝฝ PDF๏ผˆๆ”ฏๆŒ็ผ“ๅญ˜๏ผ‰
apd upload Phase 1๏ผš่Žทๅ– + ไธ‹่ฝฝ + ไธŠไผ  + ่งฆๅ‘็”Ÿๆˆ
apd download-video Phase 2๏ผšไธ‹่ฝฝๅทฒ็”Ÿๆˆ็š„่ง†้ข‘๏ผˆๆ”ฏๆŒ็ผ“ๅญ˜๏ผ‰
apd publish Phase 3๏ผšๅ‘ๅธƒๅˆฐ HuggingFace
apd publish-douyin Phase 3b๏ผšๅ‘ๅธƒๅˆฐๆŠ–้Ÿณๅˆ›ไฝœ่€…ๅนณๅฐ
apd digest ็”Ÿๆˆๆœฌๅœฐๅ‘จๆŠฅ
apd run ๅฎŒๆ•ดๆต็จ‹๏ผˆไธ€้”ฎๆ‰ง่กŒ๏ผŒ้œ€็ญ‰ๅพ…่ง†้ข‘็”Ÿๆˆ๏ผ‰
apd status ๆŸฅ็œ‹่ฎบๆ–‡ๅค„็†็Šถๆ€

ๅธธ็”จๅ‚ๆ•ฐ

--week, -w     ๆŒ‡ๅฎšๅ‘จ ID๏ผˆๅฆ‚ 2026-01๏ผ‰๏ผŒ้ป˜่ฎคๅฝ“ๅ‰ๅ‘จ
--max, -m      ๆœ€ๅคง่ฎบๆ–‡ๆ•ฐ้‡
--headful      ๆ˜พ็คบๆต่งˆๅ™จ็ช—ๅฃ๏ผˆ่ฐƒ่ฏ•ๆ—ถไฝฟ็”จ๏ผ‰
--force, -f    ๅผบๅˆถ้‡ๆ–ฐๅค„็†๏ผˆๅฟฝ็•ฅ็ผ“ๅญ˜๏ผ‰
--debug        ๅผ€ๅฏ่ฐƒ่ฏ•ๆ—ฅๅฟ—

๐Ÿ“ ็›ฎๅฝ•็ป“ๆž„

auto-paper-digest/
โ”œโ”€โ”€ apd/                    # ไธป็จ‹ๅบๅŒ…
โ”‚   โ”œโ”€โ”€ cli.py              # ๅ‘ฝไปค่กŒๅ…ฅๅฃ
โ”‚   โ”œโ”€โ”€ config.py           # ้…็ฝฎๅธธ้‡
โ”‚   โ”œโ”€โ”€ db.py               # SQLite ๆ•ฐๆฎๅบ“
โ”‚   โ”œโ”€โ”€ hf_fetcher.py       # HF ่ฎบๆ–‡ๆŠ“ๅ–๏ผˆๆ”ฏๆŒๅ‘จ URL๏ผ‰
โ”‚   โ”œโ”€โ”€ pdf_downloader.py   # PDF ไธ‹่ฝฝๅ™จ
โ”‚   โ”œโ”€โ”€ nblm_bot.py         # NotebookLM ่‡ชๅŠจๅŒ–
โ”‚   โ”œโ”€โ”€ douyin_bot.py       # ๆŠ–้Ÿณๅˆ›ไฝœ่€…ๅนณๅฐ่‡ชๅŠจๅŒ–
โ”‚   โ”œโ”€โ”€ publisher.py        # HuggingFace ๅ‘ๅธƒ
โ”‚   โ”œโ”€โ”€ digest.py           # ๅ‘จๆŠฅ็”Ÿๆˆ
โ”‚   โ””โ”€โ”€ utils.py            # ๅทฅๅ…ทๅ‡ฝๆ•ฐ
โ”œโ”€โ”€ portal/                 # HuggingFace Spaces ้—จๆˆท
โ”‚   โ”œโ”€โ”€ app.py              # Gradio ๅบ”็”จ
โ”‚   โ”œโ”€โ”€ requirements.txt
โ”‚   โ””โ”€โ”€ README.md
โ”œโ”€โ”€ data/
โ”‚   โ”œโ”€โ”€ apd.db              # SQLite ๆ•ฐๆฎๅบ“
โ”‚   โ”œโ”€โ”€ .douyin_auth.json   # ๆŠ–้Ÿณ็™ปๅฝ•็Šถๆ€
โ”‚   โ”œโ”€โ”€ pdfs/               # ไธ‹่ฝฝ็š„ PDF๏ผˆๆŒ‰ๅ‘จๅˆ†็›ฎๅฝ•๏ผ‰
โ”‚   โ”œโ”€โ”€ videos/             # ็”Ÿๆˆ็š„่ง†้ข‘๏ผˆๆŒ‰ๅ‘จๅˆ†็›ฎๅฝ•๏ผ‰
โ”‚   โ”œโ”€โ”€ digests/            # ๅ‘จๆŠฅๆ–‡ไปถ
โ”‚   โ””โ”€โ”€ profiles/           # ๆต่งˆๅ™จ้…็ฝฎ๏ผˆๅซ็™ปๅฝ•ๆ€๏ผ‰
โ”œโ”€โ”€ .env.example            # ็Žฏๅขƒๅ˜้‡ๆจกๆฟ
โ””โ”€โ”€ pyproject.toml

๏ฟฝ ็ผ“ๅญ˜ๆœบๅˆถ

PDF ็ผ“ๅญ˜

  • ๅทฒไธ‹่ฝฝ็š„ PDF ้€š่ฟ‡ SHA256 ๆ ก้ชŒ
  • ็›ธๅŒๆ–‡ไปถ่‡ชๅŠจ่ทณ่ฟ‡

่ง†้ข‘็ผ“ๅญ˜

  • ไฝฟ็”จๆ–‡ไปถๅๅ‰็ผ€ๅŒน้…๏ผˆ{paper_id}_*.mp4๏ผ‰
  • ๆ”ฏๆŒๆ–ฐ็š„ๅ‘ฝๅๆ ผๅผ๏ผš{paper_id}_{video_title}.mp4
  • ไฝฟ็”จ --force ๅผบๅˆถ้‡ๆ–ฐไธ‹่ฝฝ

ๅ‘ๅธƒ็ผ“ๅญ˜

  • metadata.json ไธญ่ฎฐๅฝ•ๅทฒๅ‘ๅธƒ็š„่ฎบๆ–‡
  • ้‡ๅคๅ‘ๅธƒ่‡ชๅŠจ่ทณ่ฟ‡

๐Ÿ“Š ็Šถๆ€่ฟฝ่ธช

NEW โ†’ PDF_OK โ†’ NBLM_OK โ†’ VIDEO_OK
 โ”‚                          โ”‚
 โ””โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€ ERROR โ—„โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”˜
็Šถๆ€ ๅซไน‰
NEW ่ฎบๆ–‡ๅทฒๆŠ“ๅ–๏ผŒๅพ…ๅค„็†
PDF_OK PDF ๅทฒไธ‹่ฝฝ
NBLM_OK ๅทฒไธŠไผ ๅˆฐ NotebookLM๏ผŒ่ง†้ข‘็”Ÿๆˆไธญ
VIDEO_OK ่ง†้ข‘ๅทฒไธ‹่ฝฝ
ERROR ๅค„็†ๅคฑ่ดฅ๏ผˆไผš่‡ชๅŠจ้‡่ฏ•๏ผ‰

ๆŸฅ็œ‹็Šถๆ€๏ผš

apd status --week 2026-01
apd status --week 2026-01 --status ERROR

๐Ÿ”ง ๆ•…้šœๆŽ’้™ค

็™ปๅฝ•้—ฎ้ข˜

apd login

NotebookLM ็•Œ้ขๅ˜ๅŒ–

ๆŸฅ็œ‹ๆˆชๅ›พ๏ผš

ls data/profiles/screenshots/

่ง†้ข‘ๆœช็”Ÿๆˆ

่ง†้ข‘็”Ÿๆˆ้œ€่ฆๅ‡ ๅˆ†้’Ÿๆ—ถ้—ด๏ผŒ่ฏท็จๅŽ้‡่ฏ•๏ผš

apd download-video --week 2026-01 --headful

HuggingFace Token ้—ฎ้ข˜

็กฎไฟ .env ๆ–‡ไปถ้…็ฝฎๆญฃ็กฎ๏ผš

cat .env
# ๆฃ€ๆŸฅ HF_TOKEN ๅ’Œ HF_USERNAME

๐Ÿค ๆŠ€ๆœฏๆ ˆ

  • Python 3.11+ - ๆ ธๅฟƒ่ฏญ่จ€
  • Playwright - ๆต่งˆๅ™จ่‡ชๅŠจๅŒ–
  • SQLite - ็Šถๆ€ๆŒไน…ๅŒ–
  • Click - CLI ๆก†ๆžถ
  • Requests + BeautifulSoup - ็ฝ‘้กตๆŠ“ๅ–
  • huggingface_hub - HF API
  • Gradio - ้—จๆˆท็ฝ‘็ซ™
  • python-dotenv - ็Žฏๅขƒๅ˜้‡็ฎก็†

๐Ÿ“„ License

MIT License ยฉ 2026

For Tasks:

Click tags to check more tools for each tasks

For Jobs:

Alternative AI tools for auto-paper-digest

Similar Open Source Tools

For similar tasks

For similar jobs