Zotero Collections 与 Tags 整理指南
建立可维护的 Zotero 文献组织体系:合理使用 collections、tags 与 saved searches,并用 BibGenie 的文献库整理功能安全地批量整理文献库。
Zotero 的 collections 和 tags 都能用来组织文献,但它们解决的是不同问题。一个可长期维护的 Zotero 文献库,通常不是只用 collections,也不是只用 tags,而是把 collections 用作项目或主题入口,把 tags 用作跨集合的检索维度,再用 saved searches 处理会动态变化的工作流。
如果你使用 BibGenie,这篇指南不只是“应该怎样整理”的方法论,也可以直接变成可执行的整理流程。BibGenie 的文献库整理功能可以盘点你现有的 collections、tags 和 items,再按你的研究体系提出整理计划,最后在你确认后批量创建 collections、添加或移除 tags、移动 items、重命名或合并混乱标签。
一句话原则
Collections 适合回答“这批文献属于哪个项目、课程、综述或主题入口?”Tags 适合回答“这篇文献有什么特征、方法、状态、对象或用途?”
BibGenie 的角色
Zotero 提供 collections 和 tags 这些基础组织能力;BibGenie 的文献库整理功能更像一个文献库整理助理:先理解你已有的组织方式,再提出可审核的修改计划,最后由你批准后执行。
有关 BibGenie 文献库整理功能的完整能力介绍和示例提示词,请参阅文献库整理文档。
快速结论
如果你刚开始整理 Zotero,可以先按下面的规则执行:
| 场景 | 推荐使用 | BibGenie 可以怎么帮 |
|---|---|---|
| 论文、课程、课题、项目、毕业论文 | Collection | 根据选中文献生成项目 collection 结构,并把文献加入对应 collection |
| 文献主题、研究方法、数据类型、地区、理论框架 | Tag | 阅读标题、摘要和元数据,建议统一的 topic/method/status tags |
to-read、read、important、reviewed | Colored tag 或普通 tag | 批量给当前阅读任务添加或移除状态 tag |
| 最近 7 天新增、未读、缺 DOI、某标签组合 | Saved search | 帮你设计搜索条件和后续整理规则 |
| 书评与被评论的书、同一作品的不同版本 | Related items | 帮你识别可能有关联的条目,但是否建立关系仍建议人工确认 |
| 大量细碎子文件夹 | 尽量避免 | 找出过深、过碎或重复的 collections,并建议合并方案 |
BibGenie 的文献库整理功能可以做什么
在 Zotero 里手动整理 collections 和 tags 时,真正耗时的不是点击按钮,而是判断:哪些标签是重复的,哪些文献该归入哪个 collection,哪些 metadata 缺失,哪些操作会影响太多条目。BibGenie 的文献库整理功能的价值就在这里。
| 任务 | BibGenie 可以执行的动作 |
|---|---|
| 盘点现有结构 | 列出 collections 层级、tag 词表、某个 collection 或 tag 下的 items |
| 找出整理对象 | 查找 unfiled items、最近新增文献、缺 DOI/abstract 的条目、某个 tag 或 collection 下的文献 |
| 设计整理方案 | 根据标题、摘要、metadata、现有 tags 和 collections 提出分类方案 |
| 批量整理 items | 给指定文献添加/移除 tags,加入/移出 collections |
| 创建 collections | 在合适的父 collection 下创建新 collection,并可同时放入候选文献 |
| 清理 tags | 重命名 tag、把旧 tag 合并到已有 tag、删除全库无用 tag |
| 整理 collections | 重命名 collection、移动 collection、删除空或无用 collection;删除 collection 不会删除其中的文献 |
| 检查 metadata | 读取完整 metadata,识别缺失字段,并在有可靠来源时辅助修正 |
BibGenie 不会绕过确认机制
修改 metadata、创建 collection、移动 items、批量改 tags、重命名或删除 collections/tags 都属于写入操作。BibGenie 会提出操作并等待用户批准,不应该在没有明确确认的情况下直接改动 Zotero library。
一个好的 BibGenie 整理请求应该包含范围、目标和限制:
Please organize the currently selected items. First read the existing collections and tags, then propose an organization plan based on titles, abstracts, and metadata.
Prefer reusing existing collections and tags; only suggest creating new ones if there is genuinely no suitable place.
Do not modify Zotero yet. First output which items will be affected, which tags will be added, and which collections will be used.这个提示词背后的原则,是 BibGenie 的文献库整理功能的核心工作流:先发现现状,再识别对象,然后提出计划,最后才执行。
Collections 是什么
Collections 是 Zotero 左侧栏中的集合和子集合。Zotero 官方建议把 collections 理解成“播放列表”,而不是电脑文件系统里的文件夹:同一条文献可以同时出现在多个 collections 中,但这不会复制文献本身。真正的完整库仍然是 My Library 或对应的 group library。
Collections 适合做“入口”。例如:
PhD Thesis2026 Systematic ReviewCourse - Research MethodsProject - AI Literature ReviewTopic - Retrieval-Augmented Generation
这种结构的好处是清楚、可见、适合项目推进。你打开一个 collection,就能看到这一项工作当前需要的核心文献。
使用 BibGenie 时,可以让它先按项目目标给出 collection 草案,而不是直接移动文献:
Please list my existing collections first, then decide whether the selected items can fit into existing collections.
If the existing structure isn't sufficient, design a one-to-two-level collection draft for my "literature review writing project."
Output each collection's purpose and the proposed items it would contain. Do not modify Zotero.删除 collection 不等于删除文献
删除普通 collection 只会删除这个组织入口,不会删除其中的文献。要真正删除文献,需要把 item 移到 Trash。这个差异对新用户很重要。
这也是 BibGenie 删除 collection 时会明确提醒你的原因:删除 collection 只是移除组织入口,items 仍然保留在 Zotero library 中。如果某个 collection 下面还有 subcollections,BibGenie 会拒绝直接删除父 collection,并要求你先决定子 collection 如何处理。
Tags 是什么
Tags 是附加在 item、attachment、note 上的文本标签。它们没有层级,但可以从多个角度描述同一篇文献。Zotero 官方文档也强调,tags 可以用于 topic、method、status、rating 或个人工作流。
Tags 适合做“维度”。例如:
- 主题:
llm-agent、scientific-discovery、citation-network - 方法:
survey、experiment、meta-analysis、case-study - 对象:
clinical-trial、graduate-students、zotero-users - 状态:
to-read、read、skimmed、cited - 用途:
intro-section、related-work、method-baseline
Tags 的优势在于组合查询。比如你可以在一个 collection 中筛选同时带有 llm-agent 和 survey 的文献,也可以在全库里找所有 to-read 且属于 citation-network 的文献。
BibGenie 的优势是可以基于文献内容批量建议 tags。比如你可以先让它只做分析:
Please list my existing tags first, then review the titles, abstracts, and existing tags of items in this collection.
Prefer reusing existing tags; only suggest new tags when no suitable one exists.
Finally, present recommended tags to keep, merge, add, and delete in a table. Do not modify Zotero.Collections vs Tags
| 比较维度 | Collections | Tags |
|---|---|---|
| 组织方式 | 可以层级化,有 subcollections | 扁平化,没有原生子标签 |
| 最适合表达 | 项目、课程、论文、主题入口 | 主题、方法、状态、质量、用途等属性 |
| 一篇文献能否多处出现 | 可以 | 可以 |
| 跨库复制时是否保留 | 通常不保留 collection 位置 | 通常会随 item 复制 |
| 适合浏览 | 强 | 中等 |
| 适合交叉筛选 | 中等 | 强 |
| 后期维护风险 | collection bloat | tag 同义词和拼写漂移 |
| 推荐粒度 | 少而稳定 | 可更细,但要命名一致 |
不要把二者设计成完全重复
如果你已经有 Topic - LLM Agents collection,就不一定需要给其中每篇文献都打 llm-agents 标签,除非你希望跨其他 collections 检索这个主题。
用 BibGenie 整理时,也建议把这句话当作规则写进提示词。比如:
Please avoid making tags and collections fully redundant. Don't mechanically add the same tag to every item when the collection already expresses the project membership. Only add topic tags when cross-collection search is needed.推荐的组织模型
对大多数研究者,一个稳妥的 Zotero 结构可以分成三层。
1. 用少量顶层 collections 管住大方向
顶层 collections 不要太多。建议把它们设计成你长期不会频繁改名的入口:
My Library
Inbox
Thesis
Papers
Projects
Topics
Teaching
Archive或者更贴近研究领域:
My Library
Domain - AI for Science
Domain - Bibliometrics
Domain - Human-Computer Interaction
Project - BibGenie SEO
Project - Zotero Workflow Study2. 用一到两层 subcollections 承载项目
Subcollections 不建议无限下钻。两层通常已经足够:
Project - Systematic Review
01 Search Results
02 Screening
03 Included Studies
04 Background Reading
05 Cited in Manuscript这种结构比按主题细分十几层更适合实际写作,因为它对应研究流程。
3. 用 tags 做可组合的横向维度
Tags 不要替代所有 collections。它们更适合记录“这篇文献还有哪些可检索属性”:
method:survey
method:experiment
topic:semantic-search
topic:zotero
status:to-read
status:read
use:background
use:key-citationZotero 没有原生层级标签,但你可以用前缀模拟命名空间,例如 method:、topic:、status:。这样能减少歧义,也更容易在 tag selector 里扫描。
Tags 命名规范
好的 tag 系统不是越多越好,而是越一致越好。
| 规则 | 推荐 | 不推荐 |
|---|---|---|
| 使用小写 | semantic-search | Semantic Search、semantic Search |
| 用连字符分词 | citation-network | citation network、citation_network |
| 给类别加前缀 | method:survey | survey、surveys 混用 |
| 状态标签保持单一 | status:to-read | unread、to read、todo 混用 |
| 避免过宽标签 | topic:llm-agent | ai、paper、research |
| 避免过临时标签污染全库 | use:intro-section | maybe-use-in-chapter-2-later |
如果已经有重复标签,可以在 tag selector 中重命名,把旧标签改成目标标签名,从而完成合并。例如把 to read 改成 status:to-read。
如果 tags 已经混乱,可以让 BibGenie 先做一次 tag audit:
Please list the current library's tags and identify potentially duplicate or synonymous tags — for example, different casing, spaces vs hyphens, singular vs plural.
Give merge suggestions and note how many items each tag affects.
Do not execute any renaming or deletion yet.确认后再执行:
I confirm the merge plan. Please rename the tag `to read` to `status:to-read`.
If `status:to-read` already exists, merge the two tags. Before executing, confirm how many items will be affected.BibGenie 的 tag 重命名和合并不是逐篇文献循环处理,而是使用 Zotero 的全库 tag 操作。把旧 tag 重命名为一个已存在 tag 时,Zotero 会把二者合并。这比手动逐篇添加新 tag、移除旧 tag 更稳,也更适合清理长期积累出的同义标签。
Colored Tags 应该怎么用
Zotero 支持给少量 tags 设置颜色,并可用数字键快速添加或移除。官方当前文档说明最多可以设置 9 个 colored tags。
Colored tags 最适合放“高频状态”,而不是放全部主题:
| Colored tag | 用途 |
|---|---|
status:to-read | 待读 |
status:reading | 正在读 |
status:read | 已读 |
use:key-citation | 关键引用 |
use:write-next | 近期写作要用 |
不建议把 machine-learning、history、statistics 这类普通主题都设成 colored tags。主题会越来越多,而 colored tags 的位置很宝贵。
BibGenie 不能替你决定哪些 tags 应该长期占用 colored tag 位置,但它可以帮你找出最常用的状态类 tags,并建议是否合并为更少的高频标签。
自动标签要不要保留
Zotero 从数据库、网页或图书馆目录保存条目时,有时会自动带入 subject headings 或 keywords。这些 automatic tags 有时有用,但也经常制造噪音:大小写不一致、粒度混乱、过于宽泛、数量膨胀。
建议策略:
- 新库或重度整理用户:关闭自动标签,手动维护核心 tags。
- 医学、法律、图书馆学等依赖受控词表的用户:可以先保留自动标签,再定期清理。
- 已经积累大量自动标签的用户:先隐藏 automatic tags,确认无用后再批量删除。
关闭路径通常是 Zotero Settings / Preferences 的 General 页面,取消 Automatically tag items with keywords and subject headings。
如果不确定哪些 automatic tags 有价值,可以让 BibGenie 先按频次和语义分组:
Please check the current library's tags and list those that may be from automatic import, overly broad, or inconsistently cased. Do not delete anything, just give cleanup suggestions.Saved Searches 是被低估的组织工具
Saved searches 类似“智能 collections”。它保存的是搜索条件,不是固定结果,所以会随着文献库变化自动更新。
适合 saved searches 的场景:
Unread: tag 不是status:readRecent Additions: 最近 7 天添加的文献Missing DOI: DOI 为空的文献Need Review: 带有status:to-read且属于某个 collection 的文献Key RAG Papers: 同时带有topic:rag和use:key-citation
如果你发现自己反复用同一组条件筛选文献,就应该考虑创建 saved search,而不是新建一个静态 collection。
BibGenie 更适合帮你设计 saved search 的规则,而不是把所有动态任务都变成 collection。例如:
I want to create a dynamic view of "unread RAG papers."
Please review my existing tags and collections first, then suggest Zotero saved search criteria.
If existing tags aren't suitable, explain which tags need to be standardized first.BibGenie 也可以先用类似 saved search 的思路帮你找整理对象,例如“最近 30 天新增且还没有进入任何 collection 的文献”“缺 DOI 的 journal articles”“带有旧标签但没有新标签的文献”。这类任务适合先输出候选清单,再决定是否批量修改。
Related Items 应该怎么用
Related items 不适合替代 tags 或 collections。论坛讨论中也有人指出,Related 的问题是它只能说明“两条文献有关”,但不能清楚表达“为什么有关”。因此它更适合明确的一对一或少量关系:
- 书评和被评论的书
- 会议论文和扩展后的期刊论文
- 数据集论文和使用该数据集的基准论文
- 同一研究项目的预印本、正式版和勘误
- 一篇综述中反复讨论的核心源文献
如果你只是想表达“这些文献都属于同一主题”,优先用 tag 或 collection。
三种常见工作流
工作流 A:写论文或综述
为写作项目创建一个 collection,例如 Project - LLM Agent Review。
把候选文献先放入 01 Search Results 或 Inbox。
用 tags 标记主题、方法和状态,例如 topic:tool-use、method:benchmark、status:to-read。
筛选后把核心文献移动或加入 03 Included Studies。
用 use:key-citation、use:intro-section、use:method-section 标记写作用途。
适合配合 BibGenie 的提示词:
Please examine the `Project - LLM Agent Review` collection.
First list the existing subcollections and tags, then classify the papers into five categories following a review writing workflow: search results, screening, included, background, and cited.
Prefer using existing subcollections; justify any new ones needed.
First output a table, do not move any items yet.确认后再说:
I confirm this classification table. Please add these items to the corresponding collections per the table, and add the `use:key-citation` tag to core papers.
After completion, summarize how many items were modified, which collections were used, and which tags were added.工作流 B:长期积累某个研究领域
建立一个长期 collection,例如 Domain - AI for Science。
只在真正需要时创建少量 subcollections,例如 Foundation Papers、Benchmarks、Applications。
用细粒度 tags 记录主题、方法、数据集、实验对象。
定期检查 Unfiled Items,把游离文献加入合适 collection 或删除。
适合配合 BibGenie 的提示词:
Please analyze the items in `Domain - AI for Science`.
First read the existing tags, identify 5 to 8 stable research topics, and suggest corresponding `topic:` tags.
Avoid creating too many subcollections; prefer tags unless a topic will be maintained separately long-term.工作流 C:轻量用户
如果你不想维护复杂体系,可以只使用最小规则:
- Collections:按项目或课程建。
- Tags:只用 5 到 15 个高频状态或主题。
- Colored tags:只标
to-read、read、important。 - 每月清理一次 automatic tags、duplicates 和 unfiled items。
轻量系统比复杂但没人维护的系统更可靠。
轻量用户也可以使用 BibGenie,但重点应该是“减少维护成本”,不是生成更多标签:
Please classify the currently selected items into only three statuses: `status:to-read`, `status:reading`, `status:read`. If you can't determine the status, put it in `status:to-read` and show a preview first.定期维护清单
建议每月做一次 Zotero library housekeeping:
- 打开
Unfiled Items,处理没有进入任何 collection 的文献。 - 打开
Duplicate Items,合并重复条目,不要直接删除其中一个。 - 检查 tag selector,合并同义标签,例如
methods和research-methods。 - 隐藏或删除无用 automatic tags。
- 检查最近新增文献的 title、author、year、DOI、abstract 是否干净。
- 删除已经失去意义的临时 subcollections,避免 collection bloat。
用 BibGenie 辅助整理
可以让 BibGenie 先列出候选文献和拟修改内容,再执行批量添加 tags、创建 collections、移动 items 或检查元数据。对任何批量修改,都建议先预览,并限制范围,例如“只处理当前选中文献”或“只处理这个 collection”。
一个稳妥的 BibGenie 月度整理提示词:
Please help me with Zotero library housekeeping:
1. First list existing collections and tags.
2. Check for unfiled items, duplicate or synonymous tags, overly deep collections, and recently added unorganized items.
3. When checking items missing DOI or abstract, consider the item type to determine whether a DOI is actually expected.
4. Only output the problem list, impact scope, and suggested actions. Do not modify Zotero.如果你想把 unfiled items 放入合适位置,可以进一步让 BibGenie 执行一个更具体的任务:
Please find the most recent 50 unfiled items and determine which collections they best fit into based on existing collections.
Do not create new collections unless the existing structure clearly has no suitable place.
First output each item, the suggested collection, the reason, and your confidence level.常见错误
错误 1:把 collections 当成唯一组织系统
如果每个小主题都建一个 subcollection,几年后很容易出现几十甚至上百个 collections。文献会被埋在很深的树里,找起来反而更慢。
使用 BibGenie 时,也不要让它为每个小主题都创建 collection。更好的要求是:“只有长期项目、课程、论文或稳定主题才创建 collection;细粒度概念优先使用 tags。”
错误 2:tags 没有命名规则
to read、ToRead、unread、todo 如果同时存在,检索会失效。Tag 系统最怕同义词漂移。
BibGenie 可以帮你发现这些漂移,并把旧 tag 重命名到统一 tag。重命名到已有 tag 时,本质上就是一次合并操作。
错误 3:用 Related 表达主题归属
Related 更适合明确关系,不适合把一批主题相近的文献串起来。主题归属应该用 tag 或 collection。
错误 4:忘记 subcollection 的显示设置
Zotero 中,子集合里的文献默认不一定显示在父集合中。可以通过 View -> Show Items from Subcollections 改变显示方式。这个设置会影响你如何理解父子 collection,因此团队协作时最好统一规则。
错误 5:长期不处理 automatic tags
自动导入的 tags 会让 tag selector 变得嘈杂。除非你明确依赖这些关键词,否则应该定期隐藏、删除或关闭自动标签。
错误 6:把“整理整个 library”当成一个模糊命令
“帮我整理全部文献库”听起来方便,但它通常太宽泛。BibGenie 的文献库整理功能更适合从具体痛点开始,例如:
- 最近新增但未归档的文献。
- 某个 collection 下需要继续细分的文献。
- 重复或同义 tags。
- 缺 DOI、abstract 或 publication title 的条目。
- 某个项目写作中需要标记
use:key-citation的核心文献。
更好的提示词是:
Please don't organize the entire library yet. Help me diagnose the 3 most pressing categories of issues: unfiled items, duplicate tags, and missing metadata. Only output the problem scope and suggested next steps.错误 7:让 AI 填写它无法验证的 metadata
BibGenie 可以检查 metadata,也可以在有可靠来源时辅助修正 metadata,但不应该让 AI 自己编写 DOI、摘要、期刊名、作者或页码。对 metadata 写入,可靠来源应该来自 Zotero 当前 metadata、用户提供的信息、已读取的文献内容,或 BibGenie 可验证的外部引用查询结果。
好的提示词是:
Please check the metadata completeness of the most recent 20 items. For entries missing a DOI or abstract, only suggest corrections when verifiable through reliable sources. Mark unverifiable items as "unconfirmed" and do not generate or guess content.推荐模板
你可以直接从这个模板开始:
Collections
Inbox
Project - [项目名]
01 Search Results
02 To Screen
03 Included
04 Background
05 Cited
Domain - [长期主题]
Foundation Papers
Methods
Applications
Archive
Tags
status:to-read
status:reading
status:read
use:key-citation
use:intro-section
use:method-section
method:survey
method:experiment
method:case-study
topic:[主题名]用 BibGenie 执行时的安全流程
BibGenie 可以管理 tags、collections、item 归属和部分 metadata,但文献库整理属于会改变 Zotero 数据的操作。推荐始终使用“四步法”:
先让 BibGenie 读取现有结构:collections、tags,以及本次要整理的 item 范围。
要求 BibGenie 优先复用现有 collections 和 tags;只有确实没有合适位置时才建议新建。
要求 BibGenie 输出整理计划,包括新增 tags、删除 tags、移动到哪些 collections、影响哪些 items,以及哪些操作需要批准。
人工确认后,再明确授权 BibGenie 执行;执行后要求它总结修改数量、跳过项和未完成项。
推荐提示词模板:
Please organize the currently selected items. The goal is to establish clear Zotero collections and tags:
1. First list existing collections and tags.
2. Prefer reusing existing collections and tags; don't create similar names unnecessarily.
3. Determine which items should go into the same collection.
4. Then suggest consistent `topic:`, `method:`, `status:` tags.
5. Output which tags and collections will be added or removed for each item.
6. Do not modify Zotero yet; wait for my confirmation.确认后:
I confirm the organization plan above. Please execute these changes, then summarize how many items were modified, which tags were added, and which collections were used.对于 50 篇以上的大批量操作,建议把要求写得更明确:
This is a large batch organization task. First give a brief plan including which existing collections/tags will be used, whether new ones are needed, how many items will be affected, and which write operations need my approval.
After I confirm, execute in focused batches by shared purpose. Do not run one operation per item.如果只是重命名、合并或删除全库 tag,不要让 BibGenie 逐篇修改 item。应该直接描述 tag 级操作:
Please merge the library-wide tag `methodology` into the existing tag `method:methods`.
First confirm that both tags exist and how many items are affected, then wait for my approval.如果只是重命名或移动 collection,也应该让 BibGenie 操作 collection 本身,而不是新建 collection 后再搬运全部 items:
Please rename the collection `Old Thesis Reading` to `Project - Dissertation Reading`.
First list the matching collection key and its item count, wait for my confirmation, then execute.参考资料
- Zotero 官方文档:Collections and Tags
- Zotero 官方知识库:Organizing a library
- Zotero Forums: tags and collections best practice?
- Zotero Forums: Collections vs tags
- Zotero Forums: best use for related, tags, collections
- Mastering Zotero: Working with Tags
- Zotero Manual: Tags
- Harvard Library: Organize Your Zotero Library
- UMGC Library: Collections & Tags
- Massachusetts General Hospital: Organizing Your Library
- Catherine Pope: Keeping Your Zotero Library Tidy
- Reddit: Collections and Tags
BibGenie 文档