注:本文是去年《论统筹方法在法律类“重复性、机械化”工作中的应用》文章的延续,今后将成为一个系列,专门记载笔者在工作过程中“减少工作量”的奇思妙想。
一、技术背景及摘要
教师授课、法庭辩论、相声艺术等以即兴创作为基础的口述作品,在其诞生之时通常并未固定于物质载体之上,而只有借助录音录像设备,才得以将前述无形智力成果固化为电子数据,最终产生确权基础——毕竟,一旦脱离录音录像制品,任何人都将无法证明在地球的某时某刻,某个口述者真的创作出了多么富有美感的即兴作品。
口述作品的核心美感以及大部分创造性元素,均来源于脱口而出的声音所对应的文字,而不在乎口述者的表情或肢体动作等。因而,口述作品实质性相似的比对,须将音频或视频中口述者的“讲述声音转化为直观的“文字形式”,且须在每一句话标注视频所在的时间戳,进而类比文字作品或文学作品的实质性相似判断方法,进行口述作品的相似性判断。
实务中,收集视频平台口述作品录像进行实质性相似比对时将面临以下情况:
1、基于平台技术保护措施的加密视频文件:
优爱腾等一众平台的缓存功能均不指向视频源文件,而是指向特殊格式的加密文件,如爱奇艺指向.qsv文件、优酷指向.kux文件;
现有技术的局限性在于:
前述加密文件只能经由平台官方软件播放,无法进行第三方播放,亦不支持使用传统格式转换工具进行解码、转码;
2、基础素材不适格
口述作品录像制作者常常并未制作与视频对应的字幕文件;
实际上传至视频平台的、带有字幕的视频中,字幕并不是外挂于视频之外的.srt/.ass/.ssa等格式的文件,而是与视频画面本身一同渲染成逐帧画面;
现有技术的局限性在于:
前述情况直接导致侵权对比工作并无现成的文字素材可用,而需要化身“打字录入员”,将视频中口述者的全部讲话一一记录,并记载特定语句所在的时间戳;在视频长度达到几个小时乃至十几个小时的情况下,侵权比对的前期工作繁杂程度将成倍增长,恐怕又是一桩“费实习生”的“苦差事”
3、转化为文字后,就实质性相似情况进行人工比对过度耗费精力

这一点显而易见,比较两组文字间的相似之处是体力和智力劳动范畴的双重折磨。虽然某种程度上,实质性相似的判断理论上可以依靠“直观感受”,但审判者直观感受的对象不是从天上掉下来的,而是必须由对抗双方自行编排有利于己方的比对表格,从而方便审判者进行判断。

就这一点而言,笔者并未找到令人满意的技术解决方案。

二、解决思路
1、如何破坏视频平台的权利保护措施?

作为一个法律人,采用侵权手段提高法律工作的效率可谓是家常便饭(不是)。

规避或破坏视频平台的技术保护措施主要有两种方向,第一种是尝试直接获取视频平台资源的原始视频文件,这一种方向又可划分为两个细分策略:

在PC端视频网站使用下载工具作资源嗅探,直接获取视频源文件;

使用第三方平台提供的解析接口对视频资源的地址作解析,以获取视频资源的真实地址;两种策略外部表现形式不一致,但基本原理是相同的。

第二种是尝试转码特殊格式的视频缓存文件,此时只需检索近期发布的专用转换工具。考虑到加密方式可能随着视频软件版本号的变化而改变,故超过两年的工具不一定还有效。

当然,最笨的方法莫过于录屏,但其不失为一种保底解决方案。

2、如何为无字幕的录像制作字幕文件?

借助Youtube自带的字幕生成功能(基于语音识别),可以将涉案视频上传至Youtube,随后google一下借助第三方工具尝试下载由Youtube生成的字幕。

除了白嫖油管,还可以薅阿里云的羊毛,参见Github平台wxboolvideo-srt-windows项目。

笔者成功采用这种方式,注册阿里云并开通访问控制、对象存储OSS和智能语音识别服务。随后使用VidioSrt工具,填写一系列对象存储位置及语音识别项目的accesskeysecret等数据,便可实现从本地载入.mp4视频,提取视频音轨并上传至阿里云对象存储空间,随后调用语音识别api完成字幕的生成。

3、如何借助工具降低人工排列组合的工作量?
到了这一环节,笔者现有的计算机基础知识已经难以驾驭这样“高端”的客户需求了。在高人的帮助下,朋友基于Hamming Distance,写了段35行的python代码,成功降低了我们的工作量。
当然,这种比对方法非常基础,难以做到像自然语言处理那样的程度。经过讨论,最后我放弃了,并发下毒誓:下辈子投胎还是不学法了,学NLP去吧……
三、升华文章主旨

其实这件事令我十分悲伤。

当我们沉浸在技术迅猛发展的宏大叙事里时,也许早已默认了一个存疑的观点:“技术一定可以给普通人带来实惠”。

但实际上,实习生群体是被“抛弃”的一族,这并不是指实习生身份低微、或存在被剥削的风险,而是说,我们并未能够在众多繁杂的苦力活中找到可以轻易获取的技术解决方案,尽管最需要技术、也最可能率先通过技术获得解放的群体是社会中最默默无闻的“实习生”。

苦力活很低端是吗?

如果是大型电影制片公司的侵权诉讼,标的上亿,这应该够高端了吧。但非常遗憾,无论是上亿的案子,还是几千块钱的小案子,实质性相似的对比材料均不可能从天上掉下来,无论如何都要耗费大量时间比对材料,这是既有民事诉讼制度带来的结构性问题,你总不能不举证让法官自己摸索吧?

任何行业,最高端的大事,都有着最繁琐的杂事。无论高端大案,还是低端小案,没有实习生可以独善其身。此时,与其责怪民诉、证据制度,不如感慨:人类文明的局限大抵如此。

在上一篇文章,我曾提及统筹方法,并强调统筹方法是一种思想。但归根结底,我们努力寻求统筹方法的根本目的是在桎梏中寻求自我解放、自我救赎。

注:

本文发布于“难以接收到高端、代表未来的5g信号,而是用着越发缓慢的4g电信网迟迟传不了文章”的拥挤地铁车厢内。

四、引文

本文适用技术的全部贡献来源于开源软件和由用户上传免费分享的工具:

[1][Windows] 优酷kux转换MP4的简便方法
Web Link: https://www.52pojie.cn/forum.php?mod=viewthread&tid=1149628
@echo offsetlocal enabledelayedexpansionset ffmpeg=".nplayerffmpeg.exe"if exist %ffmpeg% (for /r . %%i in (*.kux) do (%ffmpeg% -y -i "%%i" -c:a copy -c:v copy -threads 2 "%%~dpni.mp4")) else echopause
[2][Windows] 【搬运】爱奇艺视频格式转换工具(qsv转mp4)
Web Link: https://www.52pojie.cn/thread-701054-1-1.html

[3]wxbool/video-srt-windows
Web Link: https://github.com/wxbool/video-srt-windows

本篇文章来源于本人微信公众号: 不能使用该名称
最后修改:2022 年 05 月 01 日
如果觉得我的文章对你有用,请随意赞赏