李星:经过竞争打拼出的标准才具备生命力

2019-12-26
来源:中国教育网络    

  李星清华大学教授,曾任IETF体系架构委员会(IAB)委员

  IETF历史发展

  IETF的使命是出版高质量的技术文档

  互联网的发展过程中,治理从第一天就开始了。互联网最初诞生时,和治理有关的组织是ARPANET工作组,后来演变成Internet工作组,此后又产生了ICCB、IRG、ICB,最后到了现在的IAB、IETF、IRTF等。而从资源方面来讲,有3项需要治理的重点内容:IP地址、域名以及协议标准和参数。

  互联网工程工作组IETF是全世界最重要的互联网技术标准机构。今天,IETF汇聚了大量关注互联网体系结构发展和运行的网络设计者、运营商、供应商和研究人员,形成了一个大型的开放式国际技术社区。

  IETF的使命是通过出版高质量的技术文档(RFC文档)影响人们设计、运行、使用和管理互联网的方式,使互联网能更好地运作。

  和国际电信联盟(ITU)等多边治理的组织不同,IETF的参与主体是工程师个人,不代表其所在国家和企业,而这也是IETF的活力所在。

  具体架构上,首先,由于工程师个人参与,仅代表自己,不能代表组织,也不能代表国家,因此不需要经过官僚主义的流程,效率非常高。为保护IETF参与主体的权益,由互联网协会(ISCO)对其提供财政和法律支持。互联网架构委员会(IAB)负责定义整个互联网的架构和长期发展规划。互联网工程指导委员会(IESG)负责IETF活动和标准制定程序的技术管理工作,具体指导各个领域工作组的运行。

  从领域划分的架构来看,通用领域跟治理更有关系,网络层包括网络领域和路由领域,传输层是传输领域,应用层是应用领域,跨层的是运行领域和安全领域。

  成功协议的特性

  标准的互联网体系结构是什么?最简单的一个说法是:互联网只有一个目的——互操作,特别是网络设备和软件的互操作。

  一个成功的互联网协议应具有如下特点:第一,需要有价值,真正满足需求;第二,可以逐步地部署;第三,操作代码具有可用性且不受使用限制,规范和维护具备开放性;最后,要成为新标准的技术,只改善10%的性能是不够的,要有巨大的改进。

  开放、合作、乐在其中

  IETF有一句格言:我们拒绝国王、总统和选举;我们相信大概一致和可以运行的程序。也就是说,如果要打造互联网标准,就不能迷信任何人。什么叫“可以运行的程序”?从更深层的内涵看,相当于“实践是检验真理的惟一标准”,同样非常符合我国的治理思路。

  相关人士对参与IETF工作的工程师有这样的描述:“热情、聪明、外向,技术卓越,穿着随性,朋友遍天下”。IETF具备过程开放、技术主导、志愿参与、责权一致等特点。

  总的来说,参与IETF工作,第一,要解决真实问题;第二,要聚焦关键问题;第三,要全局考虑;第四,要通过邮件进行交流、交朋友,并鼓励年轻人参与;最后,要乐在其中,不要将IETF工作当成苦差。

  IETF统计数据

  RFC作者数量中国现居第二

  从发布时间来看,RFC发布数量的第一个峰值是ARPANET建立之时;从1994、1995年开始,国家科学基金网(NSFNET)逐渐退休,互联网逐步商业化。从RFC参会人数来看,2000年左右达到了一个高峰期,这是源于网络泡沫时期,“蹭会”的人数特别多。

  从RFC类型来看,除了早期RFC,有标准类、信息类、实验类、历史类、最佳实践类等等。其中,最有影响力的RFC类型是标准类(Proposed standard,standard)和最佳实践类(Best Current Practice,BCP)。此外,不必过度迷信RFC,RFC有的是说明一个信息类,有的甚至是早期的工程师为了娱乐创作的一首诗等等。还有一个特别需要注意的是,RFC的时间标注一般只有月份,没有具体日期,如果有RFC的标注是某年的4月1日,那是愚人节的笑话。国内有关“IPV9”的宣传者声称有相关RFC标准,那就是4月1日的RFC,是愚人节的笑话,千万别当真。

  作者来源方面,互联网最早在美国诞生,来自美国的作者远远领先;而中国参与RFC虽然较晚,但作者数已上升为第二位,数据比较可喜。从RFC作者所属机构来看,按照已发布RFC数量排序,排在第一位的是思科,第二是爱立信,第三是华为。

  判断一篇文章,常常要看它的引用率和指数,RFC也同理。从技术类RFC引用次数来看,被引用数最多的就是RFC 0971(互联网协议IP)。从RFC作者H指数分布来看,具有幂律分布的特性:H指数大于25的只占0.01%;H指数大于5的,也仅有不到4%。也就是说,从现阶段看,少数“牛人”对互联网标准的贡献非常大。

  2010年,IETF79在北京举行

  中国参与IETF历史

  中国参与IETF已经有25年的历史。1994年,NCFC代表中国接入Internet;1996年清华大学提交RFC1922,是中国第一个RFC;1998年,CERNET IPv6接入到全球IPv6试验网6Bone;2005年,中国大陆参加IETF的人数在各个国家或地区中排名进入前8名;2006年,中国第一本IETF的专著,清华大学撰写的《互联网工程工作组聚焦的前沿技术》出版;2008年,中国的网民数量达到2.53亿,成为世界上网民最多的国家;2010年,清华大学吴建平获得IETF最高奖Jonathan Postel奖,IETF79在北京举行;2013、2014、2017年,中科院胡启恒、中科院钱华林、清华大学吴建平先后入选互联网名人堂;2013年~2015年、2019年~2021年,清华大学李星和华为的李振斌分别成为IAB成员。

  中国主持参与制定IETF核心技术标准共有100余项,从作者(第一作者)所属机构分布看,RFC数量最多的是华为,58项;第二位是清华大学,21项;接下来是CNNIC、中国移动、中国电信等。截止2018年6月,全球RFC共有8439项,中国只占1.2%,还有很大的进步空间。

  参与IETF标准制定

  李星教授参与IETF的经历,源于教育网CERNET和CNGI-CERNET2的建设机遇;参与RFC标准制定的主要贡献,就是IPv4到IPv6的过渡技术。

  为什么采用IVI翻译技术

  由IPv4向IPv6过渡,可以采用双栈技术、封装技术和翻译技术。双栈本身具有“利他”性质,但是如果所有人都采用双栈这条路,都等待着别人去改造,也就没有人会升级IPv6。这种情况下,避开主流的“红海”,以反向的角度做创新,IPv4/IPv6的“翻译”互通,成了最好的选择。

  这个思路是从中国教育和科研计算机网的实践中逐步产生的。在过渡计划上,CERNET是IPv4网络,而CERNET2采用纯IPv6网络。首先,CERNET2在性能上优于CERNET;其次,相比CERNET的分担费用模式,CERNET2是免费的。通过高性能、免费使用的策略在校园推广IPv6的使用,采用这样的激励机制在校园网推广IPv4到IPv6的过渡,算是成功了一半。但是如果将CERNET关掉,只保留IPv6网络,依然行不通,因为很多资源仍在IPv4网络里。IPv4/IPv6翻译技术的思路也就由此诞生。

  无状态翻译IVI技术的名称来源很有意思:罗马数字Ⅳ代表4,Ⅵ代表6,“IVI”则代表4-6打通。其基本技术概念是:第一,IPv4和IPv6本身不兼容,不可能真的“互通”。第二,翻译互通的基本原理是:通过翻译器将真实的IPv4计算机映射成虚拟的IPv6计算机,同时通过翻译器将真实的IPv6计算机映射成虚拟的IPv4计算机,使得在互相不兼容的IPv4和IPv6协议空间内,分别有真实的计算机和虚拟的计算机进行端对端的通信。第三,如何指定虚拟计算机的地址?IPv6地址为128位,一个IPv6的子网就有64位,可以轻易地表示32位的IPv4互联网,但如何用有限的IPv4地址表示IPv6是IVI最大的突破点。此外,协议处理的难点是分片处理,IPv4规定路由器也可以分片,IPv6则规定只有端系统能分片,路由器不能分片,而IPv6的报头比IPv4大20bit,因此,在从IPv4到IPv6的翻译过程中会超出允许的MTU(最大传输单元)。

  研制历程

  研发新技术的过程一般是理解逐步深化的过程,漫长而曲折。1994年,CERNET开始建设IPv4网络,在CERNET的建设中,意识到中国学生有3.2亿,跟美国人口差不多,IP地址肯定不够用;1998年,CERNET开展IPv4 over IPv6实验,联入了世界下一代互联网试验床6Bone;2000年,我们建设和运行的中国自然科学基金网NSFCNET尝试采用IPv4/IPv6双栈模式;2004年,CNGI-CERNET2的纯IPv6网络建成;2005年,采用IPv4overIPv6隧道的办法使IPv4可以跨越纯IPv6网络,创立了IETF工作组softwire;2007年,发明了解决IPv4协议和IPv6协议的互联互通技术“IVI”技术;2011年发明了双重翻译技术dIVI,解决了纯IPv4应用和应用层程序嵌入地址的问题;2014年,将隧道和翻译技术统一起来,实现了IPv4/IPv6过渡技术的突破。

  在国际互联网标准制定方面,从2008年IETF72爱尔兰的都柏林会议到2016年IETF96德国的柏林会议,历时9年共25次IETF会议,终于完成由清华大学主导的9个相关的RFC标准。在这一过程中,经历了大量的质疑和讨论,这些质疑有些是对方未能理解技术,也有最初设计不够完善的地方,我们在两个关键的节点开放了源码,和IETF的进程与时俱进。正是上述介绍IETF的精神使翻译过渡技术的标准化过程终于完成。经历了激烈的IETF过程,使IVI技术得到了认可,也使相关的RFC在中国RFC作者H指数分布和RFC引用率排名上,都遥遥领先。

  技术与利益密不可分

  2013年,李星教授成为IAB成员。他分享了在IAB的几年里经历的三个难忘事件。

  第一件,在最初加入IAB时,参与了开放互联网(Open Internet)宣言的制定。宣言里强调了如下关键点:“技术自愿采用”,IETF的标准是自愿实施的;二是要“网络各层允许不同玩家”,一个人不可能包打天下;三是“自下而上的创新”;四是“功能互操作性”;五是“全世界可达”,技术标准要做到全球通用;最后是“必要时才协作,有可能就竞争”,经过竞争打拼出的标准才具备生命力。

  第二件,是IETF的工程师对斯诺登事件的反应。事件分为两个阶段。第一个阶段,“棱镜门”爆料称中国的网络和计算机被美国国安局入侵,体现的是中国政府跟美国政府之间的矛盾,美国网络工程师对此的反应是沉默的。第二个阶段,斯诺登爆料美国国安局不仅监控中国、还监控美国的盟友,甚至iPhone及黑莓手机都有美国国安局的后门,美国人自己也处于监控之中。这时局面发生了很大变化,舆论一下子爆炸了,几乎所有的美国工程师都议论纷纷,对美国政府这一行为表示不满。

  由此IETF召开了一个“强化互联网”的大会,大会上提出了五个问题:

  第一,这种大规模的监测是不是网络攻击,IETF是否愿意对无处不在的监视攻击做出回应?大家异口同声地说是(Overwhelming YES.Silence for NO);

  第二,对这种网络攻击,IETF是否要采取措施,订立标准?绝大多数人表示赞成(Very strong YES.Silence for NO);

  第三,怎样阻止有人监测端对端的加密,IETF是否应该采取加密措施,甚至在可行的情况下包括外部认证?有不少人表示赞成(Strong YES.Silence for NO);

  第四,IETF是否应尽全力实现端到端的加密,即使路径中存在中间件?大家的反应是混合的,表示赞成的人居多(Mixed response,but more YES than NO),虽然在会议上李星教授表示了反对,认为全部加密会导致互联网分裂的后果,但主流的结论是,未来5到10年互联网90%的流量都要加密;

  第五,当今互联网使用了很多不安全的协议,IETF是否应该为流行的协议创建一个安全的替代方案?大部分表示赞同,也有部分不赞同(Mostly YES,but some NO.)。

  从这个事件来看,虽然做IETF标准是技术工作,但跟国家利益,以及全球网络的治理格局都息息相关。如何能保持互联网的开放特性,又能兼顾政府的监管,是最迫切的事。

  第三件,在担任IAB成员期间,实现了IANA的管理权移交,将包括协议参数管理、地址管理及域名管理的功能转移给全球多利益攸关方社区组织ICANN。

  (本文根据清华大学教授李星在“互联网治理与域名系统安全”研讨会上的讲话整理,刊载于《中国教育网络》杂志11月刊;整理:项阳)