【摘 要】 目前最流行的电子文档格式--pdf文档,集多媒体信息于一身,交互方式丰富,并且可在web上发布和传递具有独特优势。本文在分析pdf文档和web数据库进行双向数据传递机理的基础上,对如何利用pdf文档结合asp技术开发网络学习资源进行了探讨。
【关键词】 pdf文档;asp;网络资源
数字化、网络化、信息化成了新世纪人们生活的一种状态。每个角落、每个部门、每个领域都渗透着计算机和计算机网络。计算机网络的大撞击,网络学习资源使教育也在发生质的飞跃,给远程教育带来了欣欣向荣的景象。面对众多纷繁的网络学习资源,也存在一个物竞天择的问题。pdf文档作为一种跨平台的通用电子格式,对文档信息及多媒体信息的传播有独特的优势。
一、pdf文档在web上的技术优势
1. pdf文档集多媒体信息于一身
pdf(portable document format便携文档格式)为adobe公司开发的一种电子文档格式,它将文字、字型、格式、颜色、图形图象、超文本链接、声音、动态图象等信息封装在一个文件当中的一种通用电子格式,目前已成为数字化信息上的一个工业标准。和普通的web不同,pdf文档能将多媒体信息捆绑在一起,文件位置发生变化时根本不用担心其他信息的丢失。利用pdf文档在网络上传递多媒体信息具有一定的技术优势。
2. pdf文档具有交互性
pdf文档在web上发布信息时常用的交互事件驱动行为(action)有下面几种类型:
● go to view:跳转到当前文档某处,显示文档内容或打开另一个pdf文档某处显示文档内容。此行为和html中的超链结相比更具灵活性。
● open file:打开一个非pdf文档文件,如与pdf文档同在web上的html程序、asp(active server pages)程序、flash动画文件等。
● wold wide web link:跳转到指定的url,可以使用http、ftp、mailto协议定义的超级链接。
● reset form:清除pdf文档表单中各域当前内容,恢复原设计时定义的缺省值。此行为能够实现动态信息更新。
● submit form:提交pdf文档表单中各域变量的值给指定的url,如cgi(common gateway interface)程序、asp程序等。
● show/hide field:显示或隐藏指定的交互元素对象。它非常适用于建立动态信息显示、动态交互窗口显示的页面。
这些交互事件驱动行为类型,在web上可以产生丰富的交互方式,使得pdf文档在web上增色不少。
3. pdf文档在web上出版和传输能力
pdf文档是一种通用的文件格式,不论什么样的应用程序或平台,pdf都可以保存所有原始文档的文本信息及多媒体信息,文件占用的空间很小,非常便利于电子邮件或互联网的发放和携带信息传播。
只要使用含acrobat reader插件的网络浏览器都可以在web上阅读pdf文档。对于支持pdf文档分页下载显示的服务器,并且在acrobat reader浏览插件的选项设置中使用了后台下载选项, pdf文档页面内容显示的速度将大大提高。目前支持pdf文档分页下载显示的web服务器很多,常见的有:website,website professional,fastrack server 2.0,enterprise server 2.0等。对于不支持pdf文档分页下载显示的服务器产品,通过网关接口程序(cgi)、activex技术,可以能轻而易举地达到这一目的。
二、pdf文档的结构
pdf文档的组成,有三个层次:
● 内容层。包含文件中所有文字和图象的内容。
● 基本信息层。包含有关文件的基本信息,如字体信息、导航器引用表等。
● 增强信息层。包含增强功能的信息,如超文本链接、书签内容、文章信息等。
在pdf文档中包含了一种数据存贮格式fdf(form data format),处理于表单域数据输出和导入,是一种纯文本文件。pdf文件由文件头、文件主体、交叉引用表、文件尾四个部分组成。
fdf文件头的首行表明了当前文件所使用的fdf规范版本。
fdf文件主体主要由catalog对象组成。catalog对象仅含一个关键字fdf。关键字fdf的值包含如下项目:
fields:包含一组域属性的定义
f:指定form输出或导入数据的pdf文件名等
项目fields的属性定义包含下列描述:
t:域名
v:域值
opt:选择项域的各项值等
pdf文件尾由关键字trailer间接引用fdf文件体的catalog对象关键字root的一个值对及文件结束标记%%eof组成。
pdf文档是通过一系列对象序列来构造的。pdf对象包括直接对象和间接对象,间接对象是经过标识了的pdf对象,直接对象通常有布尔型、数值型、字符串型、名字型、数组型、字典型、空对象、流对象等基本类型。一个pdf文档包含了一个以上的页面,而每一个页面都可以包含文档、图形图象,继而加入声音和动画。在多媒体信息的组合上,完全将多种媒体信息融会在一起。
三、pdf文档与web数据库
pdf文档的表单是pdf页面控制的对象,也是pdf向web数据库进行数据信息传递的接口,还可以向web数据库读取相应数据。表单的域、字段变量都能和web数据库建立数据通道。通常web数据库接受来自客户端的数据一般都采用cgi程序实现。开发cgi程序的语言工具众多纷繁。pdf文档作为目前电子文档的一种通用格式,其中提供的和web数据库接口的内部结构域和字段变量,大大增强了它在互联网上的使用。我们在构建pdf文档携带的多媒体网络信息资源过程中,借助了asp技术向web上发布pdf,同时接受来自客户端的交互数据。
1. pdf文档表单向web数据库提交数据
在adobe acrobat 4.0 pdf开发环境中,构造一个学习者登录注册(以学习者注册信息为例)信息表单的pdf文档,文件名为login.pdf,表单中各域名与web数据库字段名一一相对应起来。如图所示:(略)
表单中,按钮“注册”通过鼠标事件mouse up驱动行为submit form实现向服务器应用程序传递参数信息。在定义submit form行为时,保持服务器应用程序的url和提交信息的asp程序相一致。输出格式为html form(url encoded),选择输出的表单域的域名。
在服务器的asp应用程序中,利用vbscript语句request来获取pdf文档表单域的域名参数信息,书写格式为:
request(“field_name”)
对于接受到的pdf文档的表单数据,将通过odbc驱动注入web数据库中。服务器中的asp程序关键代码如下:
<% d1= request(“name”)%><%=d1%>
data.path=server.mappath“login.mdb”
set conn=server.createobject“adobe.connection”
conn.open “drive=microsoft access drive .mdb
dbp=&data_path
sql=“insert into dataname……” '和pdf表单域字段对应
sql=sql+values'“&d1&”'' “&d2&” '…
set rs=conn.excutesql%>
<a href=/login.pdf>return login.pdf</a>
在构造进行网络试题测试时,web数据库取数据库networktest.mdb,asp程序中部分代码同上,都是接受pdf文档表单域的参数。
2. 从web数据库中提取数据生成pdf文档
在构造的网络学习资源中,少不了要给客户端实时生成、传送试题,利用pdf文档也能轻易实现。主要就是从web数据库中读取字段数据,生成相应pdf文档表单域字段。对于上面的程序就是一个逆过程。建立一个名为test.pdf文档文件表单域字段和数据库相对应。其他设置同上所述。
服务器asp应用程序,从web数据库读取字段数据后,生成fdf文件返送浏览器pdf文档。在这里pdf文档中的fdf文件格式是asp和pdf文档的数据接口,在生成fdf格式之前必须定义服务器端的mime类型为application/vnd.fdf的语句。
从web数据库读取记录动态生成pdf文档,asp应用程序代码如下:
<% name=request“name” %>
<% if not trimname=“ ” then
data_path=server.mappath“networktest.mdb”
set conn=server.createobject“adobe.connection”
conn.open“drive= microsoft access drive.mdb dbp=”& data_path
sql=“ selectform data where name like ' ”&name&”'
set rs=conn.excutesql
if not rs.eof then
number=rs0a=rs1b=rs2
c=rs3d=rs4right=rs5
else
number=“ no found”
end if
rs.close
conn.close
endid%>
<</fdf
<</field i<</t number/v<%=number%>>>
<</t a/v<%=a%>>>
<</t b/v<%=b%>>>
<</t c/v<%=c%>>>
<</t d/v<%=d%>>>
/fnetworktest.pdf
>>
>>end obj trailer
<</root 1or>>
四、资源系统的主要组成部分
该网络学习资源系统采用了最常见的客户机/服务器网络模型(即c/s模型),如图所示:
1. pdf文档库
服务器端提供了以pdf文档为依托的多媒体信息资源库。对于所有的学习内容或测试题信息,全部以pdf文档携带。在客户浏览端,不管其浏览目的如何,附带上adobe公司的acrobat reader插件,就能很好地显示出学习的内容。其页面上的内容,不会因为浏览器的设置不同而出现异样。pdf文档的制作简单,可以使用word97、2000,也可以使用acrobat 4.0。(目前acrobat 5.0新版本的功能有了很大的扩充,和pdf文档相关的主要有:基于adobe pdf 文件快速编制新文档和使用 adobe pdf表单搜集更为准确的信息,降低成本。文档的结构和制作方式没有多大的变化。作为在4.0版本环境中开发的文档和资源,在5.0版本中同样可以使用。)这为后期的维护提供了极大的方便。图为pdf文档的制作流程:(略)
本网络资源开发应用于摄影技术基础的网络学习。现以照相机的结构原理一节为例,对pdf文档的制作过程和应注意的事项加以说明。照相机结构原理的讲解采用文本描述、图象展示、声音解说和动画演示。制作一个完整的、包含上述信息组合的pdf文档的步骤如下:
(1)制作、收集素材 即对以上的四种媒体信息进行制作、加工。文字描述应尽量形象化,并结合图片来讲解照相机的内部结构。考虑网络传输及显示的速度,所有的图象均采用jpg格式;由于pdf文档只支持wav声音格式,因此要配置的音频内容要尽量精简;pdf文档支持所有的动画格式,如mpeg、avi、flash动画等。avi格式的动画在pdf文档中有两种播放形式:一种是嵌入式,即画面嵌在文档里面,占用了文档的部分面积;另一种是浮动式,即浮在文档上面。当画面布局过于紧凑时,浮动式可以节省页面空间。
(2)页面布局及生成 当素材收集完成后,就要将媒体信息布局组合。只要安装了acrobat4.0,word97、2000就可以将word文档生成pdf文档。word具有很强的排版功能,因此将文字和图像预先在word中处理好后,再将word文档转换成pdf文档比较方便。安装了acrobat4.0后,word“文件”菜单下就会多出一项“create pdf”子菜单。点击此命令,按照框中的提示,即可完成pdf文档的生成。此时注意,要为声音和动画留出空间。
(3)启动acrobat4.0环境,加入声音和动画 在acrobat4.0中提供了给pdf文档添加声音和动画的工具。在生成的 pdf文档的适当位置加入声音和动画后即告完成。
(4)对所使用的素材利用目录进行归类,以方便后期的维护和修改 这也是比较关键的一步。制作完成的pdf文档放置在服务器的pdf文档库中,即可用asp技术向internet发布了。
2. 课件、积件、多媒体资源库
该库存放制作pdf文档所需的多媒体元素,积件、课件资源丰富学习者的学习内容,为学习者提供多样的学习方式。方便pdf文档的交互行为的链接,也便利多媒体元素的修改而不会影响pdf文档。库中的各类资源归类存放,创建、组织、修改、维护都便利。
3. 数据库系统
web数据库以access为其数据源,主要应用在三个方面:
(1)学习者信息管理库 该数据库记录学习者的学习进程,包括学习速度、练习次数、交流次数、提问情况、成绩、学习时间等。对于每一位注册了的学习者,该库中将自动建立一个单独的表来存放学习者的学习进程。一位学习者对应一个表。该数据库可以为教师直接访问,便于了解学习者的学习状况、学习特点、学习模式等,为教师出题、组织教学资源等提供一些参考资料。
(2)交流信息库,包括师生之间、学习者之间的交流信息 本资源系统提供网上实时交流功能,相当于聊天室的实时通信方式。该聊天室和交流信息库连接,所有交流的信息都通过交流信息库进行交换。在这里,教师可以组织学生讨论,学习者可以自由发言。在聊天室里,所有成员可以随意地邀请和被邀请,讨论问题和交流经验。
(3)题库 该数据库由资源管理者或教师管理,存放针对学习内容的练习题和测试题。教师可以在此创建、管理试题,并对学习者的作答情况给予反馈。试题分为客观题和主观题。客观题可支持单选、多选、填空和判断等题型。对于客观题的作答,系统可以直接给出评分结果,并且记录下每一次的作答情况,为教师评价学习者提供必要的数据。主观题则需要教师来反馈结果。
本资源系统还提供网上非实时交流功能,相当于bbs。学习者可以在上面求助,也可以发表言论,给其他学习者指引方向。所有学习者提出的问题,全被收集在交流信息库中。这种创建信息、评论信息、交流信息的协作学习情景。
4. odbc驱动
开放数据的驱动系统数据源于access,通过odbc可以使得数据库系统中的数据向客户端发送。
5. web server和asp或cgi
web server用来接受来自客户端的请求,并结合asp或cgi实现各种数据的传递,特别是来自pdf文档表单域的数据。
6. 客户端应用程序
为能顺利地架起客户端与服务器之间的数据交流,除了具有浏览器和阅读pdf文档的插件外,作为远程教育还要具备记录学习者学习情况的数据信息。该信息不必存放在服务器上,以节省时间和空间。通常采用asp技术结合odbc在客户端虚拟服务器上建立一数据库,存放记录信息。
7. 学习者信息记录
对于学习者学习进程,除了服务器上的信息库有所记录,同时也需要在客户端也有所记录,以便于学习者查看,比较现在和过去的情况,分析自身的变化,进行自我评价。将此信息记录在客户端,还可以避免访问服务器的不便。
8. 浏览器
带有acrobat插件的web浏览器,可解释asp脚本和显示pdf文档内容,支持pdf文档的分页下载,可提高网络速度,使用同样的acrobat插件和服务器构筑同一的平台,方便双方的数据传递和交互。
五、结束语
利用pdf文档结合asp技术来开发网络资源,配置要求低,操作简单易学,pdf文档自身结构简练,传输快速,阅读方便,便于开发人员协同开发,便于资源共享和交流推广。可以预见,随着资源建设标准化的进一步推进,pdf文档作为未来电子文档标准格式之一,将在网络学习资源建设中有着更广阔的应用前景。
参考文献
1 林天.pdf文档与web数据库接口技术初探j.计算机应用,
2000,(5)
2 袁望靖,赵工凡.电子出版大师adobe acrobat 4.0m.北京:
北京希望电子出版社,2000.
3 王国荣.asp网页制作教程m.北京:人民邮电出版社,2000.