欢迎来到莲山课件网!
我要投稿

您当前的位置:

高中信息技术《获取文本信息》课件

ID:191460

页数:7页

大小:405KB

时间:2020-03-10

收藏
还剩4页未读,点击继续阅读

收藏

举报

申诉

分享:

温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档有教师用户上传,莲山课件网负责整理代发布。如果您对本文档有争议请及时联系客服。
3. 部分文档可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。

资料简介

展开

第一节获取文本信息一、用键盘输入文字键盘输入法是指利用键盘,根据一定的编码规则输入汉字的方法。英文字符只有26个,对应着键盘上的26个字符键,因此英文字符的输入、内部处理、存储和输出都可以使用同一代码,不存在什么输入法。但汉字字数繁多,常用的汉字就有6000多个,而且汉字字形复杂,编码比较困难。为了适当降低编码难度,提高计算机处理效率,目前,在用计算机处理汉字的不同环节,需要采用不同的编码方式。这些编码分为3种类型:输入码、机内码、输出码。其中,输入码是指用键盘输入汉字时使用的编码,也就是人们常说的输入法。由于汉字和键盘上的字符键没有明显的对应关系,为了能在计算机中输入汉字,人们根据汉字的读音、字形等,把汉字拆分成更小的部件,并把它们与键盘上的键产生联系,从而使我们能够通过键盘按照某种规律输入汉字。利用键盘输入汉字时,首先用一种输入法输入汉字的输入码,然后通过相应的转换程序,把输入码转换成计算机能识别、存储、处理的机内码,最后转换为输出码显示出来。例如,使用全拼输入法输入汉字“中学生”,对应的过程可以简化为下图。结合人们习惯通过汉字的读音和字形来记忆汉字的事实,研究人员发明了很多种输入法,便于快速输入汉字。汉字输入法主要可以分为以下3类。音码输入法。按照字的读音进行汉字编码,如智能ABC输入法、微软拼音输入法、全拼输入法、搜狗拼音输入法等。例如,选择智能ABC输入法后,依次敲回入键,选字框中出现一些备选字,再敲“好”字对应的数字键,就可以输入这个字。形码输入法。以笔画、字根为字的部件,按照部件的形状进行汉字编码,如五笔字型、智能五笔和郑码输入法等。例如,选择五笔字型输入法,敲VB键,可以输入“好”字。音形码输入法。采用音、形结合的方式,以字的读音为主,辅以部件的读音或形状进行汉字编码,如一码输入法、二笔输入法和自然码等。把搜集到的报刊和资料中的文章用键盘输入到计算机中,对打字速度慢的人来说,会耗费大量的时间。如果用扫描仪把资料扫描下来,再用OCR(0pticalCharacterRecognition,光学字符识别)软件识别出文字,可以加快输入速度。扫描仪是计算机的输入设备之一,可以扫描图片、文档、报纸和杂志等。用扫描仪扫描印刷品上的文字时,得到的是一幅图片,其中的文字无法编辑、排版。利用OCR软件把图片里的文字转换成计算机能识别的文本信息后,就可以用记事本、写字板、金山文字、Word等字处理软件编辑了。扫描仪的种类很多,形状也不同,但使用方法基本类似。二、扫描文章和文字识别人们最习惯和熟练的书写方式是利用笔在纸上书写。目前,在计算机中安装手写板的驱动程序和相应的软件后,就可以用在手写板上写字的方式输入汉字。计算机会根据手写板“感受”到的笔画,判断输入的是什么字,也就是把“感觉信号”转换成系统内部的文字。三、用手写板输入文字多媒体计算机能够利用语音识别技术,把录入计算机的声音信息转换为文本信息。要求计算机必须配备能录音的声卡,然后调试好传声器,就可以对着传声器用普通话语音进行文字录入。如果普通话不标准,只要用它提供的语音训练程序,进行一段时间的训练,让计算机熟悉讲话者的发音习惯,就可以提高识别率。如果计算机安装的是WindowsXP系统,可以直接使用Microsoft语音识别引擎,如果是Windows2000系统,则需要安装语音识别引擎,语音识别引擎的安装文件可以从微软公司的网站中下载。四、利用语音录入文字五、从网上下载文本信息网络为我们提供了大量的资源,通过网络,可以方便地获取大量的文本信息。实际操作时,可以根据需要下载网页中的部分文字或者整个网页和文档中的文字。

扫描关注二维码

更多精彩等你来

相关标签

客服服务微信

55525090

手机浏览

微信公众号

Copyright© 2006-2021 主站 www.5ykj.com , All Rights Reserved 闽ICP备12022453号-30

版权声明:以上文章中所选用的图片及文字来源于网络以及用户投稿,由于未联系到知识产权人或未发现有关知识产权的登记,

如有知识产权人并不愿意我们使用,如果有侵权请立即联系:55525090@qq.com,我们立即下架或删除。