智东西(公众号:zhidxcom)
编译 | Glu
编辑 | 李水青

智(zhi)东西6月18日(ri)消(xiao)息,据(ju)外(wai)媒The Information报道,各国(guo)之间(jian)对待AI抓取数据(ju)的(de)不同做法(fa)有冲(chong)突,或许还会导致政治、经济的(de)紧张局势。

本周三(san),欧盟主(zhu)要的立法(fa)(fa)机(ji)(ji)构欧洲议(yi)会已通过了一项(xiang)(xiang)名为《人(ren)工智(zhi)能法(fa)(fa)案(an)》(AI Act)的法(fa)(fa)律草案(an),这是世界上第一步监管(guan)AI的法(fa)(fa)案(an)。今年3月底,意(yi)大利(li)数(shu)据(ju)保(bao)护(hu)机(ji)(ji)构以不符合欧洲数(shu)据(ju)保(bao)护(hu)各(ge)项(xiang)(xiang)规定为由,禁用了ChatGPT。尽管(guan)意(yi)大利(li)后来(lai)撤销了这个禁令,但不难看出AIGC(生成式AI)的立法(fa)(fa)问题受到了各(ge)界关(guan)注。

欧盟严抓,美国放任,AIGC能“管”住吗?

▲欧洲议会讨论《人(ren)工智能法案》

一、OpenAI或以非盈利为由,避开数据侵权争议

The Information记者认(ren)为(wei),AIGC引发的(de)争议(yi)主要(yao)还是在于(yu)数(shu)据(ju)。数(shu)据(ju)可以帮助训练大语(yu)言(yan)模型(xing),大语(yu)言(yan)模型(xing)又能为(wei)ChatGPT、谷歌Bard等聊(liao)天机器人提供动(dong)力,所(suo)以数(shu)据(ju)很重要(yao),这些数(shu)据(ju)则通常是通过挖掘公开(kai)内(nei)容(rong)、访问数(shu)据(ju)存储库和扫描大型(xing)开(kai)放(fang)数(shu)据(ju)集获得的(de)。

但(dan)在挖掘数据(ju)的过程(cheng)中,难免会(hui)(hui)抓取到受版(ban)权保(bao)(bao)护(hu)的内容,这(zhei)引发了(le)各界人(ren)士的担忧(you)(you)。一些(xie)欧洲(zhou)数据(ju)保(bao)(bao)护(hu)监管机构(gou)担忧(you)(you)AIGC在处理个人(ren)数据(ju)时“乱来”,毕竟(jing)它们没有法律依据(ju),也(ye)不需(xu)要遵(zun)守GDPR(《一般数据(ju)保(bao)(bao)护(hu)条例》)原(yuan)则;美国联邦贸易委员会(hui)(hui)也(ye)对OpenAI和其他大型语言模型缺乏问(wen)责制(zhi)、治理提出了(le)质疑。

管理数(shu)字(zi)技(ji)术的法律还(hai)处于相(xiang)对初级阶段(duan),但历史上的例子或许可以(yi)给(ji)立法部门一(yi)些(xie)提示,如(ru)曾经深(shen)陷(xian)版权(quan)争(zheng)议(yi)的谷歌(ge)图书,它曾被作家(jia)协会起诉,但谷歌(ge)最终胜诉了(le),因(yin)(yin)为(wei)法院在(zai)因(yin)(yin)为(wei)权(quan)衡版权(quan)侵权(quan)问题(ti)时,考虑了(le)“实用(yong)性”以(yi)及“充分(fen)改造(zao)性”等问题(ti)。

与谷歌图书一样,AIGC的立法(fa)最终其实(shi)就是要回答一个问题,即大模(mo)型(xing)的数(shu)据使用(yong)是否(fou)侵犯版(ban)权。OpenAI可能会争辩说,大模(mo)型(xing)只是从他人的工作中学习,并产(chan)生的一种(zhong)类似(si)于独立思(si)考(kao)的模(mo)式(shi),因此,版(ban)权保护(hu)并不适(shi)用(yong)。

此外,OpenAI的(de)非(fei)营(ying)利(li)性(xing)公(gong)司结构(gou)可能为(wei)它的(de)数据获取提(ti)供(gong)保护(hu)。2019年,OpenAI的(de)架构(gou)进行了调整,调整后变(bian)身为(wei)两家机构(gou)——营(ying)利(li)性(xing)机构(gou)OpenAI LP和最初(chu)的(de)非(fei)营(ying)利(li)机构(gou)OpenAI。虽然盈利(li)性(xing)公(gong)司OpenAI LP正(zheng)在从版(ban)权(quan)保护(hu)材料中(zhong)获益,但最初(chu)收集版(ban)权(quan)的(de)是非(fei)盈利(li)组织(zhi)OpenAI。而许多(duo)国家在侵权(quan)保护(hu)方面,不涉及非(fei)营(ying)利(li)组织(zhi)、科学研究人(ren)员、记者和其他为(wei)公(gong)共利(li)益工(gong)作的(de)人(ren)。

二、欧盟称将出台几十项法律,包括禁止企业利用活人数据

The Information记者(zhe)认为,如果(guo)非要说的话(hua),那就是OpenAI的崛起(qi)时机、地点都不那么正确。

此(ci)刻,欧洲正准备结束过往(wang)20年所采取的不(bu)干涉、放任市场战(zhan)略,并开始在大型科技(ji)平(ping)台上展示其监管力量。欧盟称其将出台几十项新的法(fa)律(lv),它希(xi)望建立(li)一(yi)个完全规范的技(ji)术生(sheng)态系统(tong),尊重其公民的权利和(he)自由(you)。

从(cong)这个意义上说,数据(ju)保护监(jian)管机构对(dui)OpenAI的(de)打击(ji)与(yu)内容创(chuang)作者对(dui)谷歌(ge)图(tu)书的(de)诉讼威胁明显(xian)不同。一(yi)(yi)方(fang)面(mian),欧(ou)洲的(de)GDPR将(jiang)数据(ju)保护确立为一(yi)(yi)项基本权利(li),OpenAI正好给(ji)欧(ou)洲一(yi)(yi)个绝妙(miao)机会来“杀鸡儆猴”,因为对(dui)OpenAI的(de)监(jian)管可能也会震(zhen)慑(she)到其他数据(ju)驱动(dong)的(de)公(gong)司,迫使他们(men)遵(zun)守这些规则;另一(yi)(yi)方(fang)面(mian),除(chu)非(fei)在(zai)某些特定条件(jian)下,企业禁(jin)止利(li)用可识别(bie)活人(ren)的(de)有关(guan)信息。

即使OpenAI能把处理(li)个人(ren)数据(ju)(ju)的行为合(he)理(li)化,该公司仍(reng)必须遵守公平、准确(que)和合(he)法目的等(deng)数据(ju)(ju)保护(hu)原(yuan)则。此外,GPT的训练数据(ju)(ju)集(ji)自2021年9月以(yi)来一直保持固定,这让人(ren)对其提供相关(guan)信(xin)息的能力(li)产生怀疑(yi)。

但到目(mu)前为(wei)止,ChatGPT最大的问题是(shi)数(shu)(shu)据(ju)处(chu)理的不透明,即使(shi)是(shi)其(qi)开(kai)发人员也无法完全解释该模(mo)(mo)型是(shi)如何得出(chu)结(jie)论的。迄今为(wei)止,机器学习(xi)研究很(hen)少能够(gou)使(shi)这(zhei)些过程清(qing)晰可(ke)见。OpenAI可(ke)以考虑动态(tai)更新ChatGPT,以确保模(mo)(mo)型是(shi)根据(ju)当前数(shu)(shu)据(ju)进(jin)行训练的;还(hai)可(ke)以在用(yong)户设计功能投(tou)资,以确保用(yong)户不会在不知不觉中交(jiao)出(chu)他们的数(shu)(shu)据(ju)。

三、美欧数据制度差异大,美国或成AI创企避风港

目(mu)前,各国(guo)在(zai)数据(ju)保护制度存在(zai)许多差距(ju),最(zui)终可(ke)能导致(zhi)两种结(jie)果:要(yao)么(me)AI公司在(zai)全(quan)球(qiu)范围遵守更严格的(de)欧盟法律(lv);要(yao)么(me)我们可(ke)能会目(mu)睹全(quan)球(qiu)分裂,美国(guo)采取(qu)更加自由放任(ren)的(de)做法,可(ke)能会成为那些希望(wang)继续在(zai)更少限制下运营(ying)的(de)公司的(de)避风港。但最(zui)终的(de)方向还是取(qu)决于主要(yao)利益(yi)相关(guan)者,即政府、公司和公众(zhong)是否(fou)愿意(yi)参与有意(yi)义的(de)对话并找到共同点。

随着ChatGPT等AIGC技(ji)术(shu)与法律的(de)(de)斗争不断展开(kai),我们需要记住历史的(de)(de)教(jiao)训,并努力在这个快速发展的(de)(de)环境中(zhong),找(zhao)到保护(hu)个人权利与促进创新之间的(de)(de)平衡点。

结语:AIGC立法仍需各国共同协商

面(mian)对长期以来的AIGC数(shu)据侵权(quan)、缺乏问责、监管混乱等争(zheng)议(yi),欧盟于本周三在法律(lv)监管上迈出了重要(yao)的一步,出台了较为严格的《人(ren)工智(zhi)能法》以保障公众(zhong)数(shu)据安全。

但面对大模型的数据(ju)爬取,各(ge)国(guo)(guo)采(cai)取了不同的措施,如美(mei)国(guo)(guo)的自(zi)由方式则较为自(zi)由、温和。最终,对AIGC的监(jian)管很有可能变成国(guo)(guo)家(jia)与企业的结盟问题,导致全(quan)球分裂。为了避免这种分裂局(ju)面,AIGC的立方还需(xu)要(yao)各(ge)国(guo)(guo)共同讨论(lun)与协商AIGC的未来(lai)走向。

来源:The Information