PDF档案格式中文嵌入现况与问题探讨(下)

印前频道 - PDF 来源:设计在线 作者:cpcool 2010-12-23

    五、亚洲字型嵌入现况

    一、字型编码说明:

    亚洲字型要嵌入PDF档案,比英文字型的嵌入需要更多的软体,以及更复杂的技术。在此之前我们必须说明亚洲字型以及英文型的差异点,以及其在不同平台上的差异点。在亚太地区,虽然都有使用汉字,但每个国家或地区所使用的内码都不相同,兹就各地区的编码介绍如下

    (一)台湾地区

    1.Big5:俗称大五码

    2.Big5plus:Big5扩编码

    3.CNS11643:中文标准交换码

    (二)中国大陆

    1.GB2312-80:通称国标码

    2.GBK:汉字内码扩展规范

    (叁)日本

    1.ShiftJIS

    2.EUC-JIS

    (四)韩国

    1.KSC5601

    (五)其他:

    二、编码原则:

    1.文字之选择及字体悉依"国字标准字体表"为基准

    2.以2个位元组(byte)为中文码编码单位,并以16进位制之文数字表示之

    3.符合CNS5205及CNS7654之通信定则

    4.依字之使用频率而编排於各不同的字面

    5.每字面按先笔划後部首的排列顺序来编订字码

    三、CID字型与TrueType字型,PostScript字型的关系:

    CID是取自於CharacterID的缩写,此字元辨识码的功用在於帮助检索及取用字元,大量改进了其使用效能,此种方法最适合用於庞大的字体集如东方双位元文字-中文、日文、韩文等。Acrobat并非一定需要使用CID字型,亦可以使用TrueType字型,但在使用TrueType字型时若在印表机驱动程式字型选项中若选择将字型传送为Type1时,则嵌入於PDF中的中文字无法再做增字的动作,而选择将字型传送为Type42时,则嵌入於PDF中的中文字可修改增减(修改时系统中需有相同的字型)。中文PostScript字型目前尚无法适用於PDF档案格式。

    内嵌字型的最大优点便在解决文件产生者与输出者之间字型不同或对应错误的问题,现在PS流程是用字码对应,且必须是同一家字型公司的同一系列版本才可对应,字型内嵌可将此问题一劳永逸的解决。

    四、AcrobatReader能显示包含CJK文字的PDF档案的方式:

    要显示CJK文字,有两种方式。

    一是在建立PDF档案时,作者可以嵌入所有文件中使用到的字体,包含CJK字体,只要字体可以被嵌入就行。任何语言版本的AcrobatReader都可以用嵌入的CJK字体来显示PDF档案。但是因为嵌入字体的PDF档案可能会占太多空间,所以作者可能在建立档案时选择不嵌入文件中使用的所有字体,这是第二种方式;如果在这种情况下,Acrobat或AcrobatReader的使用者若要查看该PDF档案,就必须使用正确的亚洲文字字体集。

    五、目前亚洲字体集中所包含的字体:

    目前有四个亚洲字体集(繁体中文、简体中文、日文与韩文)中,每个都包括有serif与sans-serif字体。而PDF档案中嵌入的亚洲字体的类型,在Windows平台上可嵌入TrueType字体,而在Macintosh与Windows平台上可以嵌入CID格式的AdobePostScript字体。较旧的OCF格式的PostScript字体不能嵌入,此外,文件中的字体必须容许嵌入。<注叁>

    嵌入字体使PDF档案大小改变的因素取决於文件所包含的字体数量及字元多少。大体而言,一般文件中每嵌入一个C、J或K字体,PDF档案的大小就会增加2MB到3MB。Macintosh版Acrobat1.0中的「MakeCID」可将TrueType字体与较旧的OCF格式的PostScript字体转换成「Width-Only」(仅具宽度资讯)的CID字体。这些CID字体仅包含TrueType或OCF字体中使用的罗马字元的宽度资讯,Distiller在建立参考原始TrueType或OCF字体的PDF档案时,需要用到这种字形。如需更多资讯,请参阅「MakeCID」公用程式资料夹中的文件。如需在罗马语言的作业系统中建立包含CJK文字的PDF档案,仅具宽度资讯的CID字体就可派上用场。

    对於在罗马语言的系统上建立包含CJK文字的PDF来说,Acrobat中的PDFWriter是不能在罗马语言的作业系统上建立包含CJK文字的PDF档案的。然而,如果Distiller可以使用它所要制作的PostScript档案中所参考的字体,那麽Distiller就能建立含有CJK文字的PDF档案。如果PostScript档案含有嵌入的TrueType字体,您就可以在任何平台上制作此PostScript档。此外,针对目前AdobeTypeLibrary中的所有CJK字体,以及Macintosh或Windows系统中常见的TrueType字体,Distiller都附有「Width-Only」的CID字体。有了这些字体资讯,Distiller将可以在任何平台上均可成功制作PostScript档案。此外,如果制作的PostScript档案中有其他的字体需要转换,还可以用「MakeCID」公用程式建立仅具宽度资讯的CID字体。

    六、中文繁体字嵌入现况以及其所面临的问题

    目前来说,支援中文PDF档案字型内嵌的字集在Mac上只有文鼎的CIDATM字型;在PC上有文鼎的CIDPostScript字型,以目前面临的问题来说,第一就是档案大小,第二就是目前在网路上使用的USER并未普遍在个人PC上安装相关的浏览软体。特别是亚洲字型,除了浏览软体外,还必须加装亚洲文字字集方可开启嵌入亚洲字型的PDF档案。

此外在印刷业上尚未能使用PDF档输出的做法。

 

    七、未来解决方案

    PDF档案是一种非常具有发展潜力的档案格式,举凡各种格式的图文档案,皆可转成PDF档,未来无论是Microsoft系列的软体、Corel系列、Adobe系列,都将支援PDF档案格式的产生、修改、编辑以及输出。但就目前来说,除了AdobeAcrobat系列有完整的功能以外,其他软体的功能都还尚未健全,而且其他相关应用软体的种类太过繁杂,有待相关的软体开发公司开发出更具整合性的应用软体。而档案大小的问题,只有两个方法,治标的方法为将PDF以更高的比例压缩,以利传输;而治本的方法还是必须一方面开发更宽频的网路;一方面使之更普及,以利大量的资料在网路上传输。

    八、结论

    PDF档案格式并非Acrobat特有的档案格式,例如华康的DynaDoc档案格式亦为可携式文件的一种,其大致上的特性与Acrobat的PDF档案格式相近,只是功能上有些许的出入。但基本上的目的、用途、产生方式以及浏览方式是非常相近的。

    PDF档案尚有相当大的研发以及应用空间,例如在电子报方面,就是一个非常好的PDF档案应用实例,因为一般的电子报大多只有大量的文字,缺少图片以及活泼的版面,使得阅读者在浏览电子资讯时,会觉得面对满版僵硬的文字,而降低阅读的意愿;如果能将电子报编排成一般报纸的版面,以PDF档的格式表现在读者面前,如此有了活泼的版面以及图片,一定会增加使用者阅读的意愿;另外,PDF档第二层的超连结功能亦可让使用者从头条标题上直接连结,将页面导引到报纸的内文中,而省去了逐页浏览的时间。当然了,这部分的构想还得等使用者习惯於以AcrobatReader阅读档案,以及各种问题解决後,才能进入实验及应用阶段,这将是另一个网路出版的新出路。

   

声明:站内网友所发表的所有内容及言论仅代表其本人,并不反映任何网站意见及观点。

全部评论

暂无相关推荐