# ZoteroToBlog

**Repository Path**: Eason596/zotero-to-blog

## Basic Information

- **Project Name**: ZoteroToBlog
- **Description**: No description available
- **Primary Language**: Unknown
- **License**: Not specified
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 0
- **Forks**: 0
- **Created**: 2025-07-12
- **Last Updated**: 2025-07-12

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

# Zotero to Blog

> **说明** ：本仓库代码用于将Zotero导出的csv转换成markdown, 用于[vuepress](https://vuepress.vuejs.org/)博客网站

# markdown模板说明
下面是一个markdown模板，用于生成[vuepress](https://vuepress.vuejs.org/)的[vuepress-theme-plume](https://theme-plume.vuejs.press/)主题的博客
```md
---
title: {论文标题}
createTime: {创建时间（用于vuepress归档，我改为使用论文发布时间）}
permalink: /article/{文章在网站的url}/

tags:
{}

---
::: info 论文信息
| **论文题目** : {} |
| -------------------------------------------|
| **作者** : {} |
| **DOI** : {} |
| **会议/期刊** : {} |
| **发表日期** : {} |
| **摘要** : {} |  

{代码和数据集}
:::  

<!-- more -->    
{阅读笔记}

---
@[pdf zoom="95" ratio="21:29"](/papers/{文件名，用于pdf展示})
```

# 目录结构说明
```
root_dir
	├── content     # 用于存放阅读笔记 
        ├── nnU-Net a self-configuring method for deep learning-based biomedical image segmentation.md
        ├── ...
	├── markdown    # 存放最终生成的markdown
        ├── nnU-Net a self-configuring method for deep learning-based biomedical image segmentation.md
        ├── ...
	├── papers      # 存放论文pdf
        ├── Isensee 等 - 2021 - nnU-Net a self-configuring method for deep learning-based biomedical image segmentation.pdf
        ├── ...
```

# Zotero设置说明
![Zotero](./doc/zotero.png)
1. 在文库中添加一个新的分类(图中为BLOG)，用于导出文章
2. 添加**基本信息**、**摘要**、**标签**，以'/'开头的标签会被过滤，如'/done'等
3. 添加一个笔记，添加code和dataset信息，下面是一个示例，请一定按照格式填写
```md
# Code And Dataset

## Code

- [https://github.com/MIC-DKFZ/nnUNet](https://github.com/MIC-DKFZ/nnUNet)
    

## Dataset

- [D1-D10 Medical Segmentation Decathlon](http://medicaldecathlon.com)
    
- [D11 Beyond the Cranial Vault (BCV)-Abdomen](https://www.synapse.org/#!Synapse:syn3193805/wiki)
    
- [D12 PROMISE12](https://promise12.grand-challenge.org)
    
- [D13 ACDC](https://acdc.creatis.insa-lyon.fr/)
    
- [D14 LiTS](https://competitions.codalab.org/competitions/17094)
    
- [D15 MSLes](https://smart-stats-tools.org/lesion-challenge)
    
- [D16 CHAOS](https://chaos.grand-challenge.org/)
    
- [D17 KiTS](https://kits19.grand-challenge.org)
    
- [D18 SegTHOR](https://competitions.codalab.org/competitions/21145)
    
- [D19 CREMI](https://cremi.org/)
    
- [D20–D23 Cell Tracking Challenge](http://celltrackingchallenge.net)
    
- [Pretrained Models](https://zenodo.org/record/3734294)
```
# 效果预览
[生成的示例markdown](./doc/nnU-Net%20a%20self-configuring%20method%20for%20deep%20learning-based%20biomedical%20image%20segmentation.md)
![example_blog](./doc/example_blog.png)
# 使用说明
## 流程说明
1. 从zotero中导出分类，指定csv格式
2. 解析csv，存入MongoDB数据库
3. 查询数据库中某些论文是否存在字段缺失并补全（doi、摘要、发布日期等，不一定能查得到，有时候需要手动补充）
4. 使用deepseek将英文摘要翻译为中文摘要
5. 准备阅读笔记
6. 生成markdown

## 代码

**脚本**：
```shell
python main.py \
    --mongodb "mongodb://localhost:27017/" \
    --database "blog" \
    --collection "papers" \
    --root_dir "custom path" \
    --zotero_csv "zotero_export.csv" \
    --mode "csv" \
    --api_key "deepseek api key" \
    --save_parse_csv \
    --write_csv_to_db \
    --check_missing \
    --fetch_cn_abstract \
    --generate_md \
    --copy_files \
    --doi_duplicate_check
```
**参数说明**：
| 参数                      | 说明                                | 默认值                          |
| ----------------------- | --------------------------------- | ---------------------------- |
| `--mongodb`             | MongoDB 连接地址                      | `mongodb://localhost:27017/` |
| `--database`            | 数据库名称                             | `blog`                       |
| `--collection`          | MongoDB 集合名                       | `papers`                     |
| `--root_dir`            | 根目录，包含 content、markdown、papers 等  |    |
| `--zotero_csv`          | Zotero 导出的 CSV 文件路径            | `blog.csv`                   |
| `--mode`                | 流程3-6的数据来源：`all`（整个数据库）或 `csv`（只处理 CSV） | `csv`                        |
| `--save_parse_csv`      | 是否保存解析后的 CSV                      | 否（不加参数为否）                    |
| `--write_csv_to_db`     | 是否将 Zotero CSV 写入 MongoDB         | 否                            |
| `--check_missing`       | 是否查找数据库中缺失信息                      | 否                            |
| `--fetch_cn_abstract`   | 是否翻译获取中文摘要                        | 否                            |
| `--generate_md`         | 是否生成 Markdown 博客文章                | 否                            |
| `--copy_files`          | 生成 Markdown 时是否复制 PDF 文件          | 否                            |
| `--doi_duplicate_check` | 是否检查 DOI 重复项                      | 否                            |

**推荐用法**：
1. 解析zetero导出的csv，在当前目录生成一个process.csv，查看其中内容是否正确
```shell
python main.py \
    --mongodb "mongodb://localhost:27017/" \
    --database "blog" \
    --collection "papers" \
    --root_dir "custom path" \
    --zotero_csv "zotero_export.csv" \
    --save_parse_csv
```

2. 将导出的csv解析，写入数据库，查询缺失字段，翻译摘要，生成markdown，复制出对应的pdf文件，`翻译需要指定api_key，可去掉--fetch_cn_abstract项，不翻译`
```shell
python main.py \
    --mongodb "mongodb://localhost:27017/" \
    --database "blog" \
    --collection "papers" \
    --root_dir "custom path" \
    --zotero_csv "zotero_export.csv" \
    --api_key "deepseek api key" \
    --mode csv \
    --write_csv_to_db \
    --check_missing \
    --fetch_cn_abstract \
    --generate_md
    --copy_files

 python main.py --mode all --write_csv_to_db --check_missing --fetch_cn_abstract --generate_md --copy_files
```

3. 检查数据库中是否存在重复的doi
```shell
python main.py \
    --mongodb "mongodb://localhost:27017/" \
    --database "blog" \
    --collection "papers" \
    --doi_duplicate_check
```