低调的PDF,为什么成了数字文档“永远的神”?

尽管PostScript的页面描述效率已经非常高,但还是远远超出当时个人电脑的硬件能力范围,因此沃诺克和格施克最初将PostScript的服务对象定位在大型印刷工作站,直到乔布斯适时出现,改变了PostScript和Adobe公司的未来。//knowledge.wharton.upenn.edu/article/adobe-acrobat-at-20-successes-second-guesses-and-a-few-miscues/
https。

谨以此文缅怀Adobe联合创始人John Warnock博士(1940年10月6日–2023年8月19日)和Charles Geschke博士(1939年9月11日–2021年4月16日)。

2023年8月21日,美国前总统唐纳德·特朗普在他创建的社交平台“Truth(真实社交)”上发文表示,他将赴亚特兰大就涉嫌推翻2020年总统选举佐治亚州结果向该州司法当局自首。

同一天的早些时候,设计软件开发商Adobe官网发布讣告,公司联合创始人约翰·沃诺克(John Warnock)去世,享年82岁。

至少从事了一辈子出版与设计软件研发的沃诺克再也不用忍受如此糟糕的排版。

并不会有谁把这两条看起来风马牛不相及的新闻联系起来,但是可能早在三十年前的冥冥之中,命运的齿轮就已转动起来。

1993年Adobe正式发布史上第一款用于制作.pdf文件的软件Adobe Acrobat 1.0。

时间暂时回到2018年初,早已官司缠身的特朗普前竞选团队主席保罗·马纳福特(Paul Manafort)又遭受了沉重的一击。负责调查“通俄门”事件的时任美国司法部特别检察官,对马纳福特及其合伙人提出了新的指控。

比起在自家地下室搭建私人电子邮件服务器用于处理公务的美国前国务卿希拉里,拥有乔治敦大学工商管理学士和法律博士学位的马纳福特和威廉玛丽学院毕业的高材生合伙人Gates简直就是技术战五渣。

起诉书中特别提到的一个细节是,马纳福特想要通过伪造公司收入提高贷款额度,但他不知道如何编辑.pdf格式的损益表。因此他通过邮件让合伙人先把.pdf表格转换为Word文档再发给他,之后又把虚增了数百万美元收入的伪造表格发回,后者帮他重新转换成.pdf,成为马纳福特提供给贷款公司材料的一部分。这一系列邮件往来为司法调查提供了实锤,也成了最终给他定罪的关键证据之一。

专精《反海外腐败法》和白领犯罪辩护的律师及法律博主Susan Simpson截图起诉书发推表示“已无力吐槽”。

就连国际PDF协会(PDF Association)也跑来补刀,非常专业地指出马纳福特的做法十分愚蠢,由于字体替换等技术因素,从.pdf文件转换得到的Word文档很容易出现外观上的不一致,直接破坏文档的真实性。

另外马纳福特的一通神操作纯属画蛇添足,因为这种非加密的.pdf文件完全可以用Adobe Acrobat等编辑软件直接修改。最后直接嘲讽拉满:他甚至都没Google一下“在PDF中编辑文字”。

一语双关的标题杀人诛心,corruption一词既指.pdf文件的损坏又讽刺马纳福特靠伪造.pdf文件搞腐败。

让我们充分见识到了“最高端的骗局往往采用最愚蠢的方式”的PDF文件格式,不仅已经低调出道整整三十年了,而且早就以电子书、说明书、学术论文以及各色表格甚至直接用微信不便转发的“学习资料汇编”等形式渗透到了普通人生活和工作的方方面面。

根据2018年国际PDF协会的估算,.pdf文件的总数量早已达到数万亿,并且每天还在以数十亿计新增。但每每提及发明且推广了PDF的Adobe公司,人们可能最先想到的是Photoshop,毕竟PS或者“P图”已经成为了编辑图片的代名词。

关键时刻还得是Photoshop拿得出手,不过话说回来就算Photoshop再牛,说明书也得是PDF格式的。

虽然PDF并非Adobe的第一款产品,但整个公司的创立可以说和PDF密不可分。1970年代的打印机并不能像今天一样可以随意打印任意文字和图像,简单来说就是计算机没法有效准确地告诉打印机该怎么去工作。

常见的点阵打印机(上)只能应付简单的文字输出,而能够绘制复杂图形的专业绘图仪(下)又贵又慢,后者和今天的智能写字机器人其实是一回事。

时间继续回到1978年,已经在计算机图形学领域小有成就的沃诺克博士加入了由查尔斯·格施克(Charles Geschke)博士领衔的施乐Palo Alto研究中心(PARC)图像科学实验室,两人合作开发了InterPress页面描述语言,能够用来驱动施乐开发的激光打印机,相当成功地解决了复杂图文页面的打印问题。

施乐的领导层认为InterPress是一项有前景的技术,但是竟然由于担心会很快被竞争公司山寨,决定将InterPress雪藏,仅作为内部标准使用。

施乐PARC当年简直就是硅谷“芝麻开门”的宝藏,最著名的要数配备了图形用户界面(GUI)和鼠标的Xerox Alto系统,Apple创始人Steve Jobs见了就像猫看见老鼠一样馋得不行,造就了后来Macintosh系列的传奇。

倍感沮丧的沃诺克和格施克于1982年底双双辞职,合伙在沃诺克家的车库成立了新公司,跟乔布斯白手起家的历程几乎如出一辙。

公司名字则来自沃诺克家后面的一条小溪Adobe Creek,感觉多少有些随意潦草,却完全不落当年创业公司普遍追求QXYZ这些有未来科技感字母的俗套。照片中左为格施克,右为沃诺克,背景正是Adobe Creek。

两人在InterPress的基础上,很快就开发出了属于Adobe的新的页面描述语言PostScript,可以准确、简单地用线条和色彩填充描述打印内容。作为第一个能够打印包含文字、图形和数码照片的软件,PostScript给打印技术打来了革命性突破,也成为日后PDF格式的核心基础。

Adobe公司logo的最初设计稿与变迁,唯一不变的是看起来像开放三角形的首字母A,由沃诺克的妻子、平面设计师Marva亲手设计。而大名鼎鼎的矢量图形软件Adobe Illustrator最初则是Warnock为了帮助Marva简化很多手动操作开发的自动化工具。如此琴瑟和谐是否也值得国内互联网大佬们学习?

尽管PostScript的页面描述效率已经非常高,但还是远远超出当时个人电脑的硬件能力范围,因此沃诺克和格施克最初将PostScript的服务对象定位在大型印刷工作站,直到乔布斯适时出现,改变了PostScript和Adobe公司的未来。

乔布斯认为,如果电脑配套的打印机能够用来制作高质量的商业文件,将为Apple带来无可比拟的优势。在乔布斯的劝说下,Adobe将PostScript授权给Apple的网络打印机LaserWriter。为此乔布斯花费250万美元收购Adobe 19%的股份,并追加100万美元购买PostScript的专利许可。

价格昂贵和缺陷颇多并没有妨碍LaserWriter取得巨大商业成功,进而为Apple成为桌面出版领域霸主奠定了基础,Adobe也因此一举成名。

1987 年,PostScript 已成为行业标准打印机语言,Adobe 与包括IBM和德州仪器在内的19 家打印机公司签订许可协议。即使是最初拒绝以任何方式认可该语言的惠普公司也被迫采用 PostScript。1989年Apple以8900万美元出售当初购买的Adobe股票,不到六年间增值了近四十倍。

即便在PCL(打印机命令语言)协议已经成为业界标准的今天,高端打印机依然是PostScript的天下。

随着计算机性能按摩尔定律迅速提升,通过PostScript在个人电脑上直接显示复杂文档已经不是难题。1991年Warnock启动了代号为Camelot的项目,旨在创建一种可以跨操作系统的通用文件格式,且在不同品牌型号打印机上的输出效果保持完全一致,也就是说要开发传统纸张的数字版本,随后演化为Portable Document Format(PDF),即便携式文档格式。

很显然根据Google搜索结果,PDF的通用程度已经够得上全球第四大宗教了。

1993年,Adobe正式发布了售价700美元的PDF制作软件,同时PDF阅读器也卖到了50美元。

昂贵的价格和当时仍处在龟速的互联网,注定了PDF并不能像PostScript一样面世即爆款,甚至一度Adobe的董事会要取消PDF项目,不过事情也很快迎来了转机。美国国税局IRS最头疼的事之一就是每年要分发数以亿计的税表,作为可靠的电子文档格式的PDF就成了最佳选择。到了1996年的报税时节,IRS启动PDF格式税表下载服务,一口气提供了600多种各色税表。

成为IRS“御用”税表格式之后,PDF很快就在商业界得到了广泛应用,随后也迅速得到了学术界、法律界等行业的认可。虽然在初期也面临不少竞争,但是脱颖而出的PDF短短数年内就变成了数字文档的全球标准。

最初由AT&T实验室开发的DjVu格式在命名上玩得一手好梗,是法语Déjà vu既视感的缩写,主打一个高保真还原,也曾是PDF的强劲对手。

2008年,PDF格式迎来了历史性的一刻,Adobe授权ISO发布并最终控制该格式的规范,并且可以免费使用相关专利。新的PDF标准也在不断提升交互性并融入更多面向未来需求的功能。

同时旨在实现最大程度还原原始文档的PDF/A格式也成了数字化古籍和历史文档的不二选择。至于知网CAJViewer和超星阅读器好不好用大家心里都有数…… 

凭一己之力为PDF格式奠基的沃诺克,在世人眼中必定是学神一样的存在。事实上,沃诺克早在犹他大学获得数学学士和硕士学位后转行攻读计算机时,就提出了确定隐藏表面的Warnock算法,使计算机能够渲染的内容从只有线条扩展到实体对象,是现在计算机图形学中的必学基础内容。

在他总篇幅26页的博士论文中,沃诺克没用一行代码,仅凭文字叙述和示意图阐明了算法,也为自称“犹他大学历史上最短的博士论文”而洋洋自得。

Warnock算法还登上了著名科普杂志《科学美国人》1970年6月的封面,其重要程度可见一斑。

但大家可能想不到的是,沃诺克在中学时成绩平平,甚至在九年级时数学考试挂科。虽然流露出对工科专业的兴趣,但是辅导员却告诉他想都不要想。幸好高中的一位数学老师提起了沃诺克对数学的兴趣,从此数学成绩一路全A。到了硕士阶段,沃诺克凭自己的兴趣证明了抽象代数中一项数年悬而未决的定理。

沃诺克发表在《美国数学会汇刊》(Transactions Of The American Mathematical Society)上证明论文的PDF格式文档截图,每个单词都很具体但是放在一起就变抽象了。

与好友沃诺克相比,格施克的人生也不乏传奇色彩。诞生在罗马天主教家庭的格施克从耶稣会高中毕业后曾在神学院就读一年,但之后就放弃了成为神职人员的追求转而到Xavier大学学习古典学。拿着古典学的本科学位,格施克又接着读了数学硕士,1963年就在John Carroll大学当起了教授。

多年后重回Xavier大学被授予荣誉学位以及重登John Carroll大学讲台的格施克。

格施克的人生转折就发生在这个期间,当时他开除的一名差生转年回来告诉他,“你把我轰走可真是积了大德了”。这名学生辍学后找到了一份为通用电气销售计算机的高薪工作,而且不计前嫌地教会了格施克如何在当时的大型主机上编写计算机程序。

从此,格施克似乎一下爱上了编程,他编写的简单程序之一是打印用于宣布女儿诞生喜讯的信封。不久之后,格施克申请到了美国自然科学基金(NSF)的奖学金,转行进入卡内基‧梅隆大学的计算机科学系攻读博士学位,拉开了他在计算机领域辉煌事业的序幕。人们常说“名师出高徒”,像这样“劣徒成就名师”的例子怕是并不多见。

很有意思的是,格施克的父亲是一名印刷公司的制版师,经常告诫他要避免两件事:印刷业和股票市场。

恐怕他俩谁也不会想到,若干年后Geschke会创办一家为印刷出版行业服务且在纳斯达克上市的公司。

2009年,沃诺克和格施克被时任美国总统、同时也是特朗普的前任总统奥巴马授予全美为技术成就颁发的最高奖项——美国国家技术创新奖National Medal of Technology and Innovation。

尽管跟早就获此殊荣的乔布斯(1985年)和比尔·盖茨(1992年)相比有些迟到,但绝对算得上实至名归。

恐怕十数年之后,特朗普不会想到自己的命运会与二人发明的PDF关联起来。时间再倒回到两百多年前,跟特朗普诸多治国理念一致的美国国父之一本杰明·富兰克林写下过广为流传至今的一句名言:“世界上只有两件事是不可避免的,那就是税收和死亡”。

倘若富兰克林生在今天,我想一定会加上第三件事吧

*本文作者SulfuriumUranide,有机化学博士,毕业于美国达特茅斯学院,现任国际顶级化学期刊《应用化学(Angewandte Chemie)》执行编辑,曾在美国能源部国家能源技术实验室从事博士后研究,并先后担任《先进材料(Advanced Materials)》和《自然·化学(Nature Chemistry)》等知名期刊学术编辑。此前曾为我们带来《为了讲故事,人类到底虚构了多少化学元素?》一文。

参考资料:

https://www.nytimes.com/2021/04/20/technology/chuck-geschke-dead.html

https://www.vice.com/en/article/pam43n/why-the-pdf-is-secretly-the-worlds-most-important-file-format 

https://knowledge.wharton.upenn.edu/article/adobe-acrobat-at-20-successes-second-guesses-and-a-few-miscues/

https://marker.medium.com/the-improbable-tale-of-how-the-lowly-pdf-played-the-longest-game-in-tech-d143d2ba9abf

https://slate.com/technology/2018/02/paul-manafort-couldnt-convert-pdfs-to-word-documents.html

本文来自微信公众号:游戏研究社 (ID:yysaag),作者:SulfuriumUranide

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
(0)
上一篇 2023年9月14日
下一篇 2023年9月14日

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日