






















今天甲方这边提了一个需求,希望把很多的录音文件(里面是噪声),交给AI识别来分析到底是什么类型的声音,从而进行自动的溯源。
那么先解决甲方的文件存储的问题,录音文件很多,一年下来50T左右。考虑到大部分文件除了给AI学习使用之后,业务上一般也就访问最近一到两个月的数据。
所以考虑采用Mini IO双层存储的方案

Mini IO 自迁移策略
# lifecycle_migration.py
import boto3
from datetime import datetime, timedelta
from minio import Minio
from minio.lifecycleconfig import LifecycleConfig, Rule, Expiration, Filter
class StorageManager:
def __init__(self):
# 连接两个MinIO实例
self.hot_client = Minio(
"hot-minio:9000",
access_key="hot-access-key",
secret_key="hot-secret-key",
secure=False
)
self.cold_client = Minio(
"cold-minio:9000",
access_key="cold-access-key",
secret_key="cold-secret-key",
secure=False
)
def auto_migrate_old_files(self):
"""自动迁移30天前的文件到冷存储"""
# 1. 扫描热存储中30天前的文件
objects = self.hot_client.list_objects("recordings", recursive=True)
for obj in objects:
if self.is_older_than(obj.last_modified, days=30):
# 2. 复制到冷存储
self.copy_to_cold_storage(obj.object_name)
# 3. 从热存储删除(或设置标记)
self.hot_client.remove_object("recordings", obj.object_name)
print(f"Migrated: {obj.object_name}")
还要集成AI分析的功能。
AI的声纹识别后面再讲
此内容由惯性聚合(RSS阅读器)自动聚合整理,仅供阅读参考。 原文来自 — 版权归原作者所有。