# ZoteroToBlog **Repository Path**: Eason596/zotero-to-blog ## Basic Information - **Project Name**: ZoteroToBlog - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2025-07-12 - **Last Updated**: 2025-07-12 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # Zotero to Blog > **说明** :本仓库代码用于将Zotero导出的csv转换成markdown, 用于[vuepress](https://vuepress.vuejs.org/)博客网站 # markdown模板说明 下面是一个markdown模板,用于生成[vuepress](https://vuepress.vuejs.org/)的[vuepress-theme-plume](https://theme-plume.vuejs.press/)主题的博客 ```md --- title: {论文标题} createTime: {创建时间(用于vuepress归档,我改为使用论文发布时间)} permalink: /article/{文章在网站的url}/ tags: {} --- ::: info 论文信息 | **论文题目** : {} | | -------------------------------------------| | **作者** : {} | | **DOI** : {} | | **会议/期刊** : {} | | **发表日期** : {} | | **摘要** : {} | {代码和数据集} ::: {阅读笔记} --- @[pdf zoom="95" ratio="21:29"](/papers/{文件名,用于pdf展示}) ``` # 目录结构说明 ``` root_dir ├── content # 用于存放阅读笔记 ├── nnU-Net a self-configuring method for deep learning-based biomedical image segmentation.md ├── ... ├── markdown # 存放最终生成的markdown ├── nnU-Net a self-configuring method for deep learning-based biomedical image segmentation.md ├── ... ├── papers # 存放论文pdf ├── Isensee 等 - 2021 - nnU-Net a self-configuring method for deep learning-based biomedical image segmentation.pdf ├── ... ``` # Zotero设置说明 ![Zotero](./doc/zotero.png) 1. 在文库中添加一个新的分类(图中为BLOG),用于导出文章 2. 添加**基本信息**、**摘要**、**标签**,以'/'开头的标签会被过滤,如'/done'等 3. 添加一个笔记,添加code和dataset信息,下面是一个示例,请一定按照格式填写 ```md # Code And Dataset ## Code - [https://github.com/MIC-DKFZ/nnUNet](https://github.com/MIC-DKFZ/nnUNet) ## Dataset - [D1-D10 Medical Segmentation Decathlon](http://medicaldecathlon.com) - [D11 Beyond the Cranial Vault (BCV)-Abdomen](https://www.synapse.org/#!Synapse:syn3193805/wiki) - [D12 PROMISE12](https://promise12.grand-challenge.org) - [D13 ACDC](https://acdc.creatis.insa-lyon.fr/) - [D14 LiTS](https://competitions.codalab.org/competitions/17094) - [D15 MSLes](https://smart-stats-tools.org/lesion-challenge) - [D16 CHAOS](https://chaos.grand-challenge.org/) - [D17 KiTS](https://kits19.grand-challenge.org) - [D18 SegTHOR](https://competitions.codalab.org/competitions/21145) - [D19 CREMI](https://cremi.org/) - [D20–D23 Cell Tracking Challenge](http://celltrackingchallenge.net) - [Pretrained Models](https://zenodo.org/record/3734294) ``` # 效果预览 [生成的示例markdown](./doc/nnU-Net%20a%20self-configuring%20method%20for%20deep%20learning-based%20biomedical%20image%20segmentation.md) ![example_blog](./doc/example_blog.png) # 使用说明 ## 流程说明 1. 从zotero中导出分类,指定csv格式 2. 解析csv,存入MongoDB数据库 3. 查询数据库中某些论文是否存在字段缺失并补全(doi、摘要、发布日期等,不一定能查得到,有时候需要手动补充) 4. 使用deepseek将英文摘要翻译为中文摘要 5. 准备阅读笔记 6. 生成markdown ## 代码 **脚本**: ```shell python main.py \ --mongodb "mongodb://localhost:27017/" \ --database "blog" \ --collection "papers" \ --root_dir "custom path" \ --zotero_csv "zotero_export.csv" \ --mode "csv" \ --api_key "deepseek api key" \ --save_parse_csv \ --write_csv_to_db \ --check_missing \ --fetch_cn_abstract \ --generate_md \ --copy_files \ --doi_duplicate_check ``` **参数说明**: | 参数 | 说明 | 默认值 | | ----------------------- | --------------------------------- | ---------------------------- | | `--mongodb` | MongoDB 连接地址 | `mongodb://localhost:27017/` | | `--database` | 数据库名称 | `blog` | | `--collection` | MongoDB 集合名 | `papers` | | `--root_dir` | 根目录,包含 content、markdown、papers 等 | | | `--zotero_csv` | Zotero 导出的 CSV 文件路径 | `blog.csv` | | `--mode` | 流程3-6的数据来源:`all`(整个数据库)或 `csv`(只处理 CSV) | `csv` | | `--save_parse_csv` | 是否保存解析后的 CSV | 否(不加参数为否) | | `--write_csv_to_db` | 是否将 Zotero CSV 写入 MongoDB | 否 | | `--check_missing` | 是否查找数据库中缺失信息 | 否 | | `--fetch_cn_abstract` | 是否翻译获取中文摘要 | 否 | | `--generate_md` | 是否生成 Markdown 博客文章 | 否 | | `--copy_files` | 生成 Markdown 时是否复制 PDF 文件 | 否 | | `--doi_duplicate_check` | 是否检查 DOI 重复项 | 否 | **推荐用法**: 1. 解析zetero导出的csv,在当前目录生成一个process.csv,查看其中内容是否正确 ```shell python main.py \ --mongodb "mongodb://localhost:27017/" \ --database "blog" \ --collection "papers" \ --root_dir "custom path" \ --zotero_csv "zotero_export.csv" \ --save_parse_csv ``` 2. 将导出的csv解析,写入数据库,查询缺失字段,翻译摘要,生成markdown,复制出对应的pdf文件,`翻译需要指定api_key,可去掉--fetch_cn_abstract项,不翻译` ```shell python main.py \ --mongodb "mongodb://localhost:27017/" \ --database "blog" \ --collection "papers" \ --root_dir "custom path" \ --zotero_csv "zotero_export.csv" \ --api_key "deepseek api key" \ --mode csv \ --write_csv_to_db \ --check_missing \ --fetch_cn_abstract \ --generate_md --copy_files python main.py --mode all --write_csv_to_db --check_missing --fetch_cn_abstract --generate_md --copy_files ``` 3. 检查数据库中是否存在重复的doi ```shell python main.py \ --mongodb "mongodb://localhost:27017/" \ --database "blog" \ --collection "papers" \ --doi_duplicate_check ```