zotero--优化记录

gyhhl2025-06-102025-08-27

本文分享了一些利用zotero提高文献管理的免费插件和方法，主要涉及到主页期刊和影响因子的展示，文献笔记模板，文献矩阵，全文双语对照翻译，标题和摘要翻译，ai辅助阅读文献与obsidian的联用等

有些图片可能会加载缓慢

1 前提准备

1.1 所需插件

Better Notes for Zotero
Ethereal Style
Jasminum
Translate for zotero
Actions and Tags for Zotero
obsidion Note for Zotero
pdf2zh
awesome gpt
zotero paper agent

1.2 插件下载

所需插件在以下网站免费下载
zotero插件商店

2 影响因子以及分区展示

此项需要在安装EtherealStyle插件的基础上才能实现
顺带说一下Translateforzotero插件。可以实现划词划句翻译
这个插件再下载好后再设置界面配置相关的翻译服务即可。其中腾讯翻译每月有500万token的免费额度。

示例图片

https://www.easyscholar.cc/ 点击这个网站进行注册
具体设置请看官网说明文章【点击】

3 自定义标注颜色和文本

此项功能用到的是EtherealStyle插件
在高亮显示以后，会自动在左侧添加上相应的标签
通过这个自定义的标签，可以通过另外一个插件对多篇文献实现文献矩阵。方便快速对比。具体方法请看后面。当然这个插件本身也支持文献矩阵，不过需要收费。

示例图片

安装Ethereal Style插件以后，可通过shift+p，选择标注打开，也可通过zotero界面中的编辑—>设置—>阅读界面(标注颜色编辑) 如图
示例图片
然后在下面的界面设置即可

4 笔记模板的配置

这个功能主要用到了BetterNotesforZotero插件
在通过笔记模板生成英文文献笔记之前，记得需要先右键翻译标题和摘要(Translate for zotero插件)。
配置不成功以及需要更多笔记模板代码的可通过点击此链接获取

下图为通过模板生成的笔记，具体内容可通过修改模板代码来适配
示例图片

将以下代码(中英文文献通用)复制粘贴即可。可通过修改来达到自己想要的效果

<html>

<hr/>

<table border="1">

  

<h2 style="color:  #E65100; background-color:  #FFF8E1;">(${topItem.getField("date")})  ${topItem.getField("titleTranslation") || topItem.getField("title")} </h2>

  

<tr>

<td><b>期刊: <b style="color:#FF0000">${topItem.getField('publicationTitle')}</b></b>（发表日期: <b>${topItem.getField("date")}</b>）<br><b>作者:</b> ${topItem.getCreators().map((v)=>v.firstName+" "+v.lastName).join("; ")}</td>

</tr>

  
  
  

<tr>

<td><b>摘要: </b><i>${topItem.getField('abstractNote')}</i></td>

</tr>

  
  

<tr>

<td><b>摘要翻译: </b>

<!-- 要提前安装Zotero PDF Translate插件，否则摘要翻译找不到 -->

<i>${topItem.getField('abstractTranslation')}</i></td>

</tr>

  
  

<tr>

<td><b>期刊分区: </b>

<!-- 引用了zotero style插件的标签 -->

  

${{

let space = " ㅤㅤ ㅤㅤ"

return Array.prototype.map.call(

    Zotero.ZoteroStyle.api.renderCell(topItem, "publicationTags").childNodes,

    e => {

        e.innerText =  space + e.innerText + space;

        return e.outerHTML

    }

    ).join(space)

}}$

  
  

</td>

</tr>

  

<tr>

<td><b>原文PDF链接: </b>

<a href=zotero://open-pdf/0_${Zotero.Items.get(topItem.getAttachments()).filter((i) => i.isPDFAttachment())[0].key}>

                ${Zotero.Items.get(topItem.getAttachments()).filter((i)=> i.isPDFAttachment())[0].getFilename()}

    </a>

</td>

</tr>

  

<tr>

<td><b>笔记创建日期: </b>${new Date().toLocaleString()}</td>

</tr>

  

<tr>

<td><b>DOI:</b> <b style="color:#9400d3">   ${topItem.getField('DOI') || (topItem.getField('url') && topItem.getField('url').match(/10\.[^\/]+\/.+/)?.[0]) || '无DOI信息'}</b ></td>

</tr>

  

</table>

<section>

    <h2 id="background-purpose-conclusion">1️⃣ 文章基本框架</h2>

    <h3>📜 背景</h3>

<blockquote style="color: #9400d3">

        概要说明研究所处领域的现状及其重要性。

    </blockquote>

    <h3>🚩 目的</h3>

<blockquote>

        明确列出文章旨在解决的科学问题和研究目标。

    </blockquote>

    <h3>🔬 结论</h3>

<blockquote>

简明扼要地归纳出文章的主要发现与结论。

</blockquote>

  

</section>

<br>

  

<section>

    <h2 id="results-discussion">2️⃣ 结果与讨论</h2>

    <blockquote   >

        对于文章中出现的关键图表及其说明、关键机理解释以及文章的重点内容，进行详细记录和解读。

    </blockquote>

    <h3>📌 数据以及数据来源</h3>

    <h3>方法</h3>

    <h3>结论</h3>

</section>

<br>

  

<section>

    <h2 id="thoughts">3️⃣ 文章亮点思考</h2>

    <blockquote>

        <p>1、本文有什么优缺点？你是否对某些内容产生了疑问？<br>

        2、你是否认为某些研究方式可以改进，如何改进？<br>

        3、这篇文章好在哪里，只有当自己理解这篇文章好在哪里，为什么能发在顶刊上，那么你也就基本理解了全篇文章的基本内容。</p>

    </blockquote>

  

</section>

  

<br>

<section>

    <h2 id="learning-by-example-125">4️⃣ 借鉴学习（125）</h2>

    <blockquote>

        <p>“125”原则</p>

    </blockquote>

    <h3>1个思路</h3>

    <blockquote>

        <p>该文章可能为自己未来研究带来的新思路，不论是实验方法，还是研究思路上。</p>

    </blockquote>

    <h3>2个绘图</h3>

    <blockquote>

        <p>选取并分析文章中设计精良的图表，学习其形式和色彩搭配。</p>

    </blockquote>

    <h3>5个句式</h3>

    <blockquote>

        <p>提炼并记录文章中的五个优秀句式，并尝试在未来的写作中模仿使用。</p>

    </blockquote>

</section>

  
  

</html>

首先在zotero界面中，点击工具—>模板编辑器。打开以下面板。
然后新建——将模板类型改为条目—-复制模板代码——-选项—> 导入笔记模板——保存
之后打开想要添加笔记的附件pdf，在最右边选择笔记—>条目笔记—->从模板新建条目笔记—>选择刚刚创建的模板即可

5 文献矩阵

利用 Ethereal Style插件实现，不过需要收费
利用awesome gpt 插件实现，在后面ai辅助阅读中会提到

利用 Actions and Tags for Zotero插件免费实现
此次只介绍第三种，它是通过总结阅读文献时高亮标注的标签来实现。

示例图片


/**

  * @author Mulei

 * 脚本功能：从所有选中的条目中提取指定 PDF 附件内带有指定“注释标签”(Zotero 注释自身的 tag)的注释（转换为 HTML），

 * 并将同一文献中同一注释标签的内容合并到同一单元格，最后生成一个表格。

 *

 * 使用说明：

 * 1. 在 Zotero 中，使用自带的 PDF 阅读器打开 PDF，并对需要的文字做高亮或注释，然后在注释的右侧面板中添加标签（tag），如“背景”、“材料”。

 * 2. 选中一个或多个条目后运行此脚本（使用传入的 items 或 item 变量）。

 * 3. 脚本会弹窗依次提示输入新笔记的标题和要提取的注释标签（多个标签请用英文/中文逗号、英文/中文分号分隔，如“背景；材料”或“背景,材料”等）。

 * 4. 脚本会先自动删除每个条目中已生成的、包含这些标签关键字的提取注释笔记（避免重复）。

 * 5. 然后遍历每个条目，找出其 PDF 附件中带有相应标签的注释，将注释文本（高亮或注释内容）放到对应列中。

 * 6. 最后将所有提取到的注释内容以表格形式合并生成一个新的独立笔记，并弹窗显示处理结果。

 */

  

if (item) return; // 仅对所有选中项执行一次

  

const Zotero = require("Zotero");

const window = require("window");

const console = require("console");

  

// 使用传入的 items 或 item 变量

let selectedItems = [];

if (typeof items !== "undefined" && items.length > 0) {

  selectedItems = items;

} else if (typeof item !== "undefined") {

  selectedItems = [item];

} else {

  window.alert("请先选择要处理的文献");

  return;

}

  

// 弹窗提示输入新笔记的标题

let noteTitle = window.prompt("请输入新笔记的标题：");

if (!noteTitle) {

  noteTitle = "合并注释";

}

  

// 弹窗提示输入需要提取的注释标签

let annotationTag = window.prompt(

  "请输入需要提取的注释标签（逗号、分号分隔），例如：\n（默认包含标题）\n\n创新，背景，材料，方法，结论，摘录，笔记\n\n"

);

if (!annotationTag) {

  window.alert("未输入注释标签，操作终止");

  return;

}

  
  

/**

 * 将输入拆分成数组，支持：

 * - 英文逗号 (,)

 * - 中文逗号 (，)

 * - 英文分号 (;)

 * - 中文分号 (；)

 */

let annotationTags = annotationTag.split(/[,，;；]/)

  .map(tag => tag.trim())

  .filter(tag => tag.length > 0);

  

window.alert(`开始处理 ${selectedItems.length} 个条目，请稍候...\n你输入的标签: [${annotationTags.join(", ")}]`);

  

/**

 * 删除每个条目中已生成的、包含任一指定注释标签关键字的提取注释笔记

 * 删除条件：笔记内容以 <div data-citation-items 开头且包含 annotationTags 中任意一个关键字

 * （此处只是简单地用 includes 判断 HTML 内容）

 */

async function deleteIndividualAnnotationNotes(items, annotationTags) {

  for (let item of items) {

    const noteIDs = item.getNotes();

    for (let id of noteIDs) {

      let note = Zotero.Items.get(id);

      let noteHTML = note.getNote();

      if (noteHTML && noteHTML.startsWith('<div data-citation-items')) {

        // 如果笔记中包含任意一个用户输入的标签关键字，就将其删除

        if (annotationTags.some(tag => noteHTML.includes(tag))) {

          Zotero.Items.trashTx(id);

        }

      }

    }

  }

}

  

/**

 * 从单个条目中，提取其 PDF 附件中所有带有 annotationTags 中任意一个标签的注释，

 * 并将同一标签的注释文本合并到同一个字符串。

 * @param {Zotero.Item} item - 当前处理的条目

 * @returns {Object} 注释对象，键为注释标签，值为合并后的注释内容

 */

async function extractAnnotationsFromItem(item) {

  // 预先给每个用户指定的标签初始化为空字符串

  let annotationsObj = {};

  annotationTags.forEach(tag => {

    annotationsObj[tag] = "";

  });

  const attachments = item.getAttachments();

  for (let attachmentId of attachments) {

    const attachment = await Zotero.Items.getAsync(attachmentId);

    // 仅处理 PDF 附件

    if (attachment.attachmentContentType === "application/pdf") {

      const annots = attachment.getAnnotations();

      if (annots && annots.length > 0) {

        for (let annot of annots) {

          // 检查此注释的标签

          if (annot.getTags && Array.isArray(annot.getTags())) {

            let tagsOnAnnot = annot.getTags().map(tagObj => tagObj.tag);

            console.log("此注释的标签:", tagsOnAnnot, "；用户指定的标签:", annotationTags);

            // 如果此注释至少包含 annotationTags 中的一个标签，就把文本归到相应标签下

            for (let wantedTag of annotationTags) {

              if (tagsOnAnnot.includes(wantedTag)) {

                try {

                  // 获取此注释的完整HTML（高亮或批注）

                  let annotJSON = await Zotero.Annotations.toJSON(annot);

                  let res = Zotero.EditorInstanceUtilities.serializeAnnotations([

                    { ...annotJSON, attachmentItemID: annot.parentID }

                  ]);

                  let cleanHTML = res.html;

                  // 去掉外层 <div>（如果有）

                  if (cleanHTML.startsWith('<div') && cleanHTML.endsWith('</div>')) {

                    cleanHTML = cleanHTML.replace(/^<div[^>]*>/, '').replace(/<\/div>$/, '');

                  }

                  // 累加到对应标签下（此处没有添加分隔符，如果需要换行可自行加上 "<br>"）

                  annotationsObj[wantedTag] += cleanHTML;

                } catch (error) {

                  console.error("转换注释为 HTML 时出错:", error);

                }

              }

            }

          }

        }

      }

    }

  }

  return annotationsObj;

}

  

/**

 * 遍历所有选中的条目，提取 PDF 附件中带有指定标签的注释，

 * 并以表格形式生成一个新的独立笔记。

 * 表格第一列为标题，后续列为用户输入的标签；同一标签的注释内容合并在同一单元格。

 */

async function combineAnnotationsIntoSingleNote(items) {

  let tableData = [];

  for (let item of items) {

    let title = item.getField("title") || "无标题";

    try {

      let itemAnnotations = await extractAnnotationsFromItem(item);

      tableData.push({ title, annotations: itemAnnotations });

    } catch (error) {

      console.error(`处理文献 "${item.getField("title")}" 时出错:`, error);

    }

  }

  if (tableData.length === 0) {

    window.alert("未找到任何符合条件的注释");

    return;

  }

  // 构建 HTML 表格，列顺序按照 annotationTags 顺序

  let combinedHTML = `<h1>${noteTitle}</h1>\n`;

  combinedHTML += `<table border="1" cellspacing="0" cellpadding="5">\n`;

  // 表头：第一列为标题，后续列为用户指定的各个标签

  combinedHTML += `<tr><th>标题</th>`;

  annotationTags.forEach(tag => {

    combinedHTML += `<th>${tag}</th>`;

  });

  combinedHTML += `</tr>\n`;

  // 每个文献对应一行

  tableData.forEach(row => {

    combinedHTML += `<tr>`;

    combinedHTML += `<td>${row.title}</td>`;

    annotationTags.forEach(tag => {

      let cellContent = row.annotations[tag] || "";

      combinedHTML += `<td>${cellContent}</td>`;

    });

    combinedHTML += `</tr>\n`;

  });

  combinedHTML += `</table>\n`;

  // 创建新的独立笔记（standalone note），使用第一个条目的库 ID

  let noteItem = new Zotero.Item("note");

  noteItem.libraryID = items[0].libraryID;

  noteItem.parentID = null;  // 独立笔记

  await noteItem.saveTx();

  // 设置笔记内容为生成的表格 HTML

  noteItem.setNote(combinedHTML);

  await noteItem.saveTx();

  return noteItem;

}

  

// 先删除旧的提取笔记，再合并生成新的独立笔记

deleteIndividualAnnotationNotes(selectedItems, annotationTags).then(() => {

  combineAnnotationsIntoSingleNote(selectedItems).then((noteItem) => {

    if (noteItem) {

      let successMsg = "成功创建合并笔记: " + noteItem.getNoteTitle();

      console.log(successMsg);

      window.alert(successMsg);

    } else {

      window.alert("处理过程中未能创建合并笔记。");

    }

  });

});

安装完Actions and Tags for Zotero插件后，点击编辑—>设置—->选Actions and Tags for Zoter—>新建事件—->粘贴代码—->保存即可
选择需要创建文献矩阵的条目，通过设置的快捷键启动事件，然后输入笔记标题，输入标签即可

6 全文翻译

全文对照翻译有以下几种。

通过 Ethereal Style 插件实现
选中需要翻译的条目—->shift+p——>全文翻译即可。会改变原来的pdf版式，仅有译文
通过zotero沉浸式翻译插件实现
沉浸式翻译提供zotero沉浸式翻译插件不过需要收费。可以使用沉浸式翻译网页版本每月有免费额度。基本够用。
使用zotero-pdf2zh插件实现。
支持大多数的大模型。能自定义翻译服务。免费。不过配置比较繁琐。时间不多的还是使用沉浸式翻译较好。

示例图片

详细的配置方法请查看官方文档
zotero-pdf2zh官方地址
此插件基于pdfmath此开源项目实现。更多功能请查看此项目

服务配置

首先电脑需要安装python环境。
推荐直接下载miniconda创建虚拟环境。一步到位
第一步创建目录存储所需文件

创建并进入zotero-pdf2zh文件夹
下载server.py文件

# 1. 创建并进入zotero-pdf2zh文件夹
pip install uv
uv venv --python 3.10   # 创建虚拟环境
.\.venv\Scripts\activate  # 启动虚拟环境
uv pip install pdf2zh==1.9.6 flask pypdf # 安装需要的包
uv pip install pdfminer.six==20250416    # 修正pdfminer安装版本

测试PDF2zh的安装

pdf2zh 1.pdf —service bing # 1.pdf是待翻译的文件
等待翻译结束，如果失败了，说明上一步的安装出现问题。这一步会使用bing免费服务翻译文件。
1.pdf要求在当前目录下
如果以上测试后出现进度条。没有报错。且在当前目录下出现 1-dual.pdf 和 1-mono.pdf则正常

然后再当前目录下新建server.py和config.json文件
将以下代码分别复制到json文件和py文件


{
    "USE_MODELSCOPE": "0",
    "PDF2ZH_LANG_FROM": "English",
    "PDF2ZH_LANG_TO": "Simplified Chinese",
    "NOTO_FONT_PATH": "./LXGWWenKai-Regular.ttf",
    "translators": [
        {
            "name": "deepseek",
            "envs": {
                "DEEPSEEK_API_KEY": "sk-xxxxxxx",
                "DEEPSEEK_MODEL": "deepseek-chat"
            }
        },
        {
            "name": "zhipu",
            "envs": {
                "ZHIPU_API_KEY": "xxxxxx",
                "ZHIPU_MODEL": "glm-4-flash"
            }
        },
        {
            "name": "openailiked",
            "envs": {
                "OPENAILIKED_BASE_URL": "https://ark.cn-beijing.volces.com/api/v3",
                "OPENAILIKED_API_KEY": "xxxxx",
                "OPENAILIKED_MODEL": "ep-xxxx-xxxxx"
            }
        }
    ]
}

import os
from flask import Flask, request, jsonify, send_file
import base64
import subprocess
from pypdf import PdfWriter, PdfReader
from pypdf.generic import RectangleObject
import sys

services = [
    'bing', 'google',
    'deepl', 'deeplx',
    'ollama', 'xinference',
    'openai', 'azure-openai',
    'zhipu', 'ModelScope',
    'silicon', 'gemini', 'azure',
    'tencent', 'dify', 'anythingllm',
    'argos', 'grok', 'groq',
    'deepseek', 'openailiked', 'qwen-mt'
]


class PDFTranslator:
    DEFAULT_CONFIG = {
        'port': 8888,
        'engine': 'pdf2zh',
        'service': 'bing',
        'threadNum': 4,
        'outputPath': './translated/',
        'configPath': './config.json',
        'sourceLang': 'en',
        'targetLang': 'zh'
    }

    def __init__(self):
        self.app = Flask(__name__)
        self.setup_routes()

    def setup_routes(self):
        self.app.add_url_rule('/translate', 'translate', self.translate, methods=['POST'])
        self.app.add_url_rule('/cut', 'cut', self.cut_pdf, methods=['POST'])
        self.app.add_url_rule('/compare', 'compare', self.compare, methods=['POST'])
        self.app.add_url_rule('/singlecompare', 'singlecompare', self.single_compare, methods=['POST'])
        self.app.add_url_rule('/translatedFile/<filename>', 'download', self.download_file)

    class Config:
        def __init__(self, data):
            self.threads = data.get('threadNum') if data.get('threadNum') not in [None, ''] else \
            PDFTranslator.DEFAULT_CONFIG['threadNum']
            self.service = data.get('service') if data.get('service') not in [None, ''] else \
            PDFTranslator.DEFAULT_CONFIG['service']
            self.engine = data.get('engine') if data.get('engine') not in [None, ''] else PDFTranslator.DEFAULT_CONFIG[
                'engine']
            self.outputPath = data.get('outputPath') if data.get('outputPath') not in [None, ''] else \
            PDFTranslator.DEFAULT_CONFIG['outputPath']
            self.configPath = data.get('configPath') if data.get('configPath') not in [None, ''] else \
            PDFTranslator.DEFAULT_CONFIG['configPath']
            self.sourceLang = data.get('sourceLang') if data.get('sourceLang') not in [None, ''] else \
            PDFTranslator.DEFAULT_CONFIG['sourceLang']
            self.targetLang = data.get('targetLang') if data.get('targetLang') not in [None, ''] else \
            PDFTranslator.DEFAULT_CONFIG['targetLang']
            self.skip_last_pages = data.get('skip_last_pages') if data.get('skip_last_pages') not in [None, ''] else 0
            self.skip_last_pages = int(self.skip_last_pages) if str(self.skip_last_pages).isdigit() else 0

            self.babeldoc = data.get('babeldoc', False)
            self.mono_cut = data.get('mono_cut', False)
            self.dual_cut = data.get('dual_cut', False)
            self.compare = data.get('compare', False)  # 双栏PDF左右对照
            self.single_compare = data.get('single_compare', False)  # 单栏PDF左右对照
            self.skip_subset_fonts = data.get('skip_subset_fonts', False)

            self.outputPath = self.get_abs_path(self.outputPath)
            self.configPath = self.get_abs_path(self.configPath)

            os.makedirs(self.outputPath, exist_ok=True)

            if self.engine != 'pdf2zh' and self.engine in services:
                print('Engine only support PDF2zh')
                self.engine = 'pdf2zh'

            print("[config]: ", self.__dict__)

        @staticmethod
        def get_abs_path(path):
            return path if os.path.isabs(path) else os.path.abspath(path)

    def process_request(self):
        data = request.get_json()
        config = self.Config(data)
        self.translated_dir = config.outputPath

        file_content = data.get('fileContent', '')
        if file_content.startswith('data:application/pdf;base64,'):
            file_content = file_content[len('data:application/pdf;base64,'):]

        input_path = os.path.join(config.outputPath, data['fileName'])
        with open(input_path, 'wb') as f:
            f.write(base64.b64decode(file_content))

        return input_path, config

    def translate_pdf(self, input_path, config):
        base_name = os.path.basename(input_path).replace('.pdf', '')
        output_files = {
            'mono': os.path.join(config.outputPath, f"{base_name}-mono.pdf"),
            'dual': os.path.join(config.outputPath, f"{base_name}-dual.pdf")
        }
        cmd = [
            config.engine,
            input_path,
            '--t', str(config.threads),
            '--output', config.outputPath,
            '--service', config.service,
            '--lang-in', config.sourceLang,
            '--lang-out', config.targetLang,
            '--config', config.configPath,
        ]
        if config.skip_last_pages and config.skip_last_pages > 0:
            # get pages num of the pdf
            end = len(PdfReader(input_path).pages) - config.skip_last_pages
            cmd.append('-p ' + str(1) + '-' + str(end))
        if config.skip_subset_fonts == True or config.skip_subset_fonts == 'true':
            cmd.append('--skip-subset-fonts')
        if config.babeldoc == True or config.babeldoc == 'true':
            cmd.append('--babeldoc')
        subprocess.run(cmd, check=True)
        if config.babeldoc == True or config.babeldoc == 'true':
            os.rename(os.path.join(config.outputPath, f"{base_name}.{config.targetLang}.mono.pdf"),
                      output_files['mono'])
            os.rename(os.path.join(config.outputPath, f"{base_name}.{config.targetLang}.dual.pdf"),
                      output_files['dual'])
        return output_files['mono'], output_files['dual']

    # 工具函数, 用于将pdf左右拼接
    def merge_pages_side_by_side(self, input_pdf, output_pdf):
        reader = PdfReader(input_pdf)
        writer = PdfWriter()
        num_pages = len(reader.pages)
        i = 0
        while i < num_pages:
            left_page = reader.pages[i]
            left_width = left_page.mediabox.width
            height = left_page.mediabox.height
            if i + 1 < num_pages:
                right_page = reader.pages[i + 1]
                right_width = right_page.mediabox.width
            else:
                right_page = None
                right_width = left_width  # Assume same width
            new_width = left_width + right_width
            new_page = writer.add_blank_page(width=new_width, height=height)
            new_page.merge_transformed_page(left_page, (1, 0, 0, 1, 0, 0))
            if right_page:
                new_page.merge_transformed_page(right_page, (1, 0, 0, 1, left_width, 0))
            i += 2
        with open(output_pdf, "wb") as f:
            writer.write(f)

    # 工具函数, 用于切割双栏pdf文件
    def split_pdf(self, input_pdf, output_pdf, compare=False, babeldoc=False):
        writer = PdfWriter()
        if ('dual' in input_pdf or compare == True) and babeldoc == False:
            readers = [PdfReader(input_pdf) for _ in range(4)]
            for i in range(0, len(readers[0].pages), 2):
                original_media_box = readers[0].pages[i].mediabox
                width = original_media_box.width
                height = original_media_box.height
                left_page_1 = readers[0].pages[i]
                offset = width / 20
                ratio = 4.7
                for box in ['mediabox', 'cropbox', 'bleedbox', 'trimbox', 'artbox']:
                    setattr(left_page_1, box, RectangleObject((offset, 0, width / 2 + offset / ratio, height)))
                left_page_2 = readers[1].pages[i + 1]
                for box in ['mediabox', 'cropbox', 'bleedbox', 'trimbox', 'artbox']:
                    setattr(left_page_2, box, RectangleObject((offset, 0, width / 2 + offset / ratio, height)))
                right_page_1 = readers[2].pages[i]
                for box in ['mediabox', 'cropbox', 'bleedbox', 'trimbox', 'artbox']:
                    setattr(right_page_1, box, RectangleObject((width / 2 - offset / ratio, 0, width - offset, height)))
                right_page_2 = readers[3].pages[i + 1]
                for box in ['mediabox', 'cropbox', 'bleedbox', 'trimbox', 'artbox']:
                    setattr(right_page_2, box, RectangleObject((width / 2 - offset / ratio, 0, width - offset, height)))
                if compare == True:
                    blank_page_1 = writer.add_blank_page(width, height)
                    blank_page_1.merge_transformed_page(left_page_1, (1, 0, 0, 1, 0, 0))
                    blank_page_1.merge_transformed_page(left_page_2, (1, 0, 0, 1, width / 2, 0))
                    blank_page_2 = writer.add_blank_page(width, height)
                    blank_page_2.merge_transformed_page(right_page_1, (1, 0, 0, 1, -width / 2, 0))
                    blank_page_2.merge_transformed_page(right_page_2, (1, 0, 0, 1, 0, 0))
                else:
                    writer.add_page(left_page_1)
                    writer.add_page(left_page_2)
                    writer.add_page(right_page_1)
                    writer.add_page(right_page_2)
        else:
            readers = [PdfReader(input_pdf) for _ in range(2)]
            for i in range(len(readers[0].pages)):
                page = readers[0].pages[i]
                original_media_box = page.mediabox
                width = original_media_box.width
                height = original_media_box.height
                w_offset = width / 20
                w_ratio = 4.7
                h_offset = height / 20
                left_page = readers[0].pages[i]
                left_page.mediabox = RectangleObject(
                    (w_offset, h_offset, width / 2 + w_offset / w_ratio, height - h_offset))
                right_page = readers[1].pages[i]
                right_page.mediabox = RectangleObject(
                    (width / 2 - w_offset / w_ratio, h_offset, width - w_offset, height - h_offset))
                writer.add_page(left_page)
                writer.add_page(right_page)
        with open(output_pdf, "wb") as output_file:
            writer.write(output_file)

    def translate(self):
        print("\n########## translating ##########")
        try:
            input_path, config = self.process_request()
            mono, dual = self.translate_pdf(input_path, config)
            processed_files = []
            if config.mono_cut == True or config.mono_cut == "true":
                output = mono.replace('-mono.pdf', '-mono-cut.pdf')
                self.split_pdf(mono, output)
                processed_files.append(output)
            if config.dual_cut == True or config.dual_cut == "true":
                output = dual.replace('-dual.pdf', '-dual-cut.pdf')
                self.split_pdf(dual, output, False, config.babeldoc == True or config.babeldoc == "true")
                processed_files.append(output)
            if config.babeldoc == False or config.babeldoc == "false":
                if config.compare == True or config.compare == "true":
                    output = dual.replace('-dual.pdf', '-compare.pdf')
                    self.split_pdf(dual, output, compare=True, babeldoc=False)
                    processed_files.append(output)
                if config.single_compare == True or config.single_compare == "true":
                    output = dual.replace('-dual.pdf', '-single-compare.pdf')
                    self.merge_pages_side_by_side(dual, output)
                    processed_files.append(output)
            return jsonify({'status': 'success', 'processed': processed_files}), 200

        except Exception as e:
            print("[translate error]: ", e)
            return jsonify({'status': 'error', 'message': str(e)}), 500

    def cut_pdf(self):
        print("\n########## cutting ##########")
        try:
            input_path, config = self.process_request()
            output_path = input_path.replace('.pdf', '-cut.pdf')
            self.split_pdf(input_path, output_path)  # 保留原逻辑
            return jsonify({'status': 'success', 'path': output_path}), 200
        except Exception as e:
            print("[cut error]: ", e)
            return jsonify({'status': 'error', 'message': str(e)}), 500

    def single_compare(self):
        print("\n########## single compare ##########")
        try:
            input_path, config = self.process_request()
            if 'mono' in input_path:
                raise Exception('Please provide dual PDF or origial PDF for dual-comparison')
            if not 'dual' in input_path:
                _, dual = self.translate_pdf(input_path, config)
                input_path = dual
            output_path = input_path.replace('-dual.pdf', '-single-compare.pdf')
            self.merge_pages_side_by_side(input_path, output_path)
            return jsonify({'status': 'success', 'path': output_path}), 200
        except Exception as e:
            print("[compare error]: ", e)
            return jsonify({'status': 'error', 'message': str(e)}), 500

    def compare(self):
        print("\n########## compare ##########")
        try:
            input_path, config = self.process_request()
            if 'mono' in input_path:
                raise Exception('Please provide dual PDF or origial PDF for dual-comparison')
            if not 'dual' in input_path:
                _, dual = self.translate_pdf(input_path, config)
                input_path = dual
            output_path = input_path.replace('-dual.pdf', '-compare.pdf')
            self.split_pdf(input_path, output_path, compare=True)
            return jsonify({'status': 'success', 'path': output_path}), 200
        except Exception as e:
            print("[compare error]: ", e)
            return jsonify({'status': 'error', 'message': str(e)}), 500

    def download_file(self, filename):
        file_path = os.path.join(self.translated_dir, filename)
        return send_file(file_path, as_attachment=True) if os.path.exists(file_path) else ('File not found', 404)

    def run(self):
        port = int(sys.argv[1]) if len(sys.argv) > 1 else self.DEFAULT_CONFIG['port']
        self.app.run(host='0.0.0.0', port=port)


if __name__ == '__main__':
    translator = PDFTranslator()
    translator.run()

然后再终端输入uv run server.py 8888即可。此处的8888要和zotero-pdf2zh插件中对应

 * Running on all addresses (0.0.0.0)
 * Running on http://127.0.0.1:8888
 * Running on http://192.168.1.11:8888
Press CTRL+C to quit

运行后出现这个即可表示正常。

插件配置

点击编辑—>设置—>pdf2zh—>配置翻译服务即可
注意要在config.json中对应好api和相应的模型。用量大的话可选择一些免费的模型调用
示例图片
最后，选中需要翻译的文献条目，然后右键选择pdf2zh相应的翻译类型。等待即可。翻译完成后会出现在当前条目下。，每次翻译时都要确保服务正确启动
此处推荐下如果不想每次都手动开启服务的话可以使用quiker工具(能用的到的地方很多)。设置好后可以一键启动。

7 AI辅助阅读

此处暂时推荐两个插件 awesome gpt或者zotero paper agent
zotero paper agent 不需要额外配置。只需要在用时登陆即可。支持deepseek和kimi。轻便简洁

awesome gpt需要配置api key.内置功能较多。可自定义。支持文献综述.免费版不支持侧边栏个人感觉用起来没有zotero paper agent 方便

如果有quiker的话，也可以。有很多的动作库支持。如果您想在电脑任何一个界面使用ai，而不想另外打开浏览器或者切换其他界面的话

示例图片

8 联用obsidian笔记

如果习惯用obsidian做笔记的话可以试一下

此处用到zotero插件为obsidion Note for Zotero 和 Better Notes for Zotero
用到obsidian的ZotLit插件
obsidion Note for Zotero和ZotLit联用，可以使得pdf中高亮显示的标签同步到obsidian中
Better Notes for Zotero可以使得zotero中生成的笔记同步到obsidian中

这是只同步标签
示例图片
这是笔记同步

同步笔记

下载Better Notes for Zotero插件
在通过模板建立笔记之后。导出笔记
只同步标签
在zotlit插件中设置zotero文件位置
在zotero选中同步的条目，右键—>obsidian action—->creat literature note
打开刚同步过来的笔记，(此时是没有标题的。颜色也不对应)
按照下图操作
将代码粘贴到最左边的一栏。如图所示
代码中的颜色以及文字要和style插件中设置的标注对应
重复第二步即可

[!note]  **<font color = "<%=it.colorName %>"><% switch (it.colorName) {
	case "#9400d3" : 
		%>背景<%
		break;
	case "#ff8c00" : 
		%>方法<%
		break;
	case "#00bfff":
		%>结论<%
		break;
	case "#48d1cc":
		%>创新<%
		break;
	case "#00ff7f":
		%>相关<%
		break;
	case "#ff1493":
		%>学习<%
		break;
	case "#ffd700":
		%>储备<%
		break;   
	case "#ff0000":
		%>名词<%
		break;  
	case "#aaaaaa":
		%>图片<%
		break;  
	case "#ff00ff":
		%>素材<%
		break;   
	default :
		%>it.colorName<%
		}%></font> **
<span style="color:<%= it.colorName %>"><%= it.imgEmbed %><%= it.text %></span>
<% if (it.comment) { %>
---
<%= it.comment %>[pdf](<%= it.backlink %>)
<% } %>

1 前提准备

1.1 所需插件

1.2 插件下载

2 影响因子以及分区展示

3 自定义标注颜色和文本

4 笔记模板的配置

5 文献矩阵

6 全文翻译

服务配置

第一步 创建目录 存储所需文件

测试PDF2zh的安装

插件配置

7 AI辅助阅读

8 联用obsidian笔记

同步笔记

只同步标签

代码中的颜色以及文字要和style插件中设置的标注对应

gyhhl

第一步创建目录存储所需文件