Skip to content

请求新镜像前必读 #741

@z4yx

Description

@z4yx

清华大学开源软件镜像站原则上只镜像软件及衍生物(如二进制文件、源代码、字体设计素材等)。

对于下列情况我们原则上不予镜像:

  1. 由于版权、许可证等因素不能镜像
  2. 没有合适的增量同步方法
  3. 内容由海量小文件构成,同步和维护困难
  4. 内容无法由纯静态方式由 HTTP 协议呈现,需要运行特定的软件提供索引/搜索/动态生成等服务,或者要求服务运行在非标准端口的
  5. 一般不使用反向代理的方式提供镜像
  6. 单一软件的安装包下载,尤其是大多数发行版已经提供可用版本的
  7. 用户群体小且国内已有其它镜像(尤其是 CentOS 的各类衍生或复刻版)
  8. 没有自有的公开分发渠道并且除 TUNA 外其它的第三方分发渠道少于两个的
  9. 与已经提供镜像的软件缺乏实质性差别
  10. 占用空间大而利用率低
    • 例如:各发行版提供调试符号包
  11. GitHub 源码仓库、各类内核源码分支等
  12. 包含用户产生的内容(User-generated content)
  13. 以国内访问速度缓慢为由提出镜像请求的
    • 因为镜像站不是下载加速器
  14. 各类科学计算、深度学习等用途的数据集
  15. 任何使用 AI 生成的镜像请求

目前支持的同步方式按优先级排序为:

  1. rsync 协议:最成熟的同步工具,管理也最容易
  2. yum/apt 仓库:有现成的同步工具
  3. 上游提供的或社区开发的专用同步工具
  4. AWS S3:如果bucket允许列举文件的情况下可以用AWS的同步工具
  5. Github Release:只适用于少量的软件安装包下载
  6. lftp / tsumugu:只适用于网页允许目录浏览且文件不多时

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions