
学术论坛
数事其本导在用
交通运输行业政府网站搜索引擎优化的思考
张葱
(交通运输部科学研究院北京100029)
摘要:着互联网技术的不断深入发展,提索引季已经成为公众获取信息的主要途径,授索引季渗蓬率高达823%。然而我国政府网站的索引事友好性现状堪优,政府信息在提索引季的检索结果中排名整体不高。本文通过分析技索引擎工作原理、用户检索习惯、技索引擎可见性优化的意义和我国交通运输行业政府网站技索引季友好性现状,提出交通运输行业政府网站捷引季可见性优化的相关建议。
关键词:政府网站建设提索引擎优化SEO网站优化中图分类号:G206
文献标识码:A
搜索引擎优化(SearchEngineOptimization,缩写SEO)是指通过合理手段,使网站各项基本要素更适合搜索引擎的检索原则并且对用户更友好,从而更易于被搜索引擎收录、获得检索结果的优先排序。其中心思想是:基于对网站运行和用户行为的监测和数据分析,通过对网站整体框架结构进行调整、对网站内容进行合理安排、对内部链接和外部交互策略等进行优化,显著提升网站的访问速度、使网站更符合主流搜索弓擎的收录,搜索规则,提高网站在搜索引擎上的自然排名,更好的向用户传递信息,发挥信息资源的最大价值,提升网站的服务效果和品牌形象。
目前,网站搜索引擎优化技术已被国内外各类网站广泛采用,调查显示美国、英国、德国、澳大利亚等电子政务发展水平较高国家的中央政府门户网站均已加载用户行为监测代码,用来汇集分析世界各地用户的网站访问数据,改善网站服务。而我国政府网站的搜索引擎优化仍处于起步阶段,对优化工作的认识还不充分,重视程度还不高,需要在充分了解搜索引擎的工作原理,分析用户浏览习
惯的基础上,针对各行业特点,有针对性的开展优化工作, 1搜索引擎工作原理分析
搜索引擎的工作大致分为爬行抓取.预处理和排名三个阶段: 1.1能行和抓取
搜索引肇蜘蛛通过跟踪链接访问网页,获得HTML代码存人数据库。为抓取尽量多的页面,所有引擎婀蛛会跟踪页面上的链接从个页面行到另一个页面,而购蛛的带宽资源,时间都是有限的不可能爬行完所有页面,因此要想让更多的页面被收录,就要在网站和页面权重、页面更新度、导人链接、与首页点击距离等方面进行优化,吸引翊妹来抓取页面。
1.2预处理(即索引)
索引程序对抓取来的页面数据进行文字提取,中文分词、索引等处理,以备排名程序调用。搜索引擎抓取到页面后,首先要从
文章编号:1007-9416(2016)06-0250-02
HTML文件中去除各种标签、程序,提取出可以用于排名处理的网页文字内容和一些特殊的包含文字信息的代码(如Meta标签中的文字、图片代替文字链接锚文字等),然后基于词典匹配或基于统计进行中文分词,去除停止词、消除噪声,对页面进行去重处理,将页面转换成一个关键词组成的集合,记录关键词在页面上出现的额率、出现的次数,格式,位置等信息,形成索引库,同时进行链接关系计算、特殊文件处理等。因此,为了使搜索引擎更好的对页面进行索引,需要对HTML页面的精简性和关键词的词频,位置,格式,以及页面上的外部链接和页面的导人链接等进行优化。
1.3排名
用户输入关键词后,排名程序调用索引库数据,计算相关性,然后按照一定格式生成搜索结果页面。搜索引擎收到用户提交的检索词后,也需要在中文分词、去停用词、指令处理、拼写错误校正和整合搜索触发等处理过程后进行文件匹配,找出所有含有所有关键词的文件,并选择一个页面权重较高的初始页面子集进行相关性计算,影响相关性计算的因素主要包括关键词常用程度、词赖及密度、关键词位置及形式、关键词距离,链接分析及页面权重等,因此,要
提高检索结果排名,需要针对上述重要因素进行优化。 2搜索引擎用户对检索结果的浏览访问习惯分析
用户搜索关键词后,搜索引擎通常在检索结果首页返回10个自然排名结果,用户对这10个结果列表的测览和点击有很大差别,
2o05年初,enquiro.com和did一it.com对英文搜索结果页进行了一次实现跟踪实验,实验表明,用户在打开搜索结果页面后,目光会首先放在最左上角,然后向正下方移动,个浏览搜索结果,当看到感兴趣的检索结果时,横向向右阅读标题。排在最上面的结果得到的目光关注度最多,越往下越少,形成一个所谓的“金三角”。
2006年,康奈尔大学做了更进一步的实验和统计,实验结果表明,检索结果中排名前三位的检索结果得到的关注事件相差不大,
表1优化内容要求
优化内客网站结构优化网站导航优化面包屑导航优化网站URL优化 XLM地图制作
页面TDK标签优化
页面标注优化 ALT标签优化
STRONG标签和H标签优化收移日期:2016-04-08
具体要求
栏目结构以三级为最佳。
采用文本形式的链接,在CSS中定文链接文本的样式
显示栏目层级不要超过三级,在CSS中定义链接文本的样式
URL最好使用全拼或者英文,越短越好,静态化URL优于动态URL
将首页、所有栏目列表页和文档内客页URL读出并割作XML地图,更面权重按照1,0.8,0.5 区分,将XML地图存储在网站根目录下。
以标准格式分别优化网站首页,概览页和细览页的Tite,Description和keyword标签。
以标准格式分别优化网站首页,概览页,细览页,政务信息和服务系统的标注信息为图片增加ALT标签注释。
页面中涉及到栏目名称的文字、文章内容中的小标题等,应加strong标签,细览页面中的文章标题使用H1标签修陷,文档列表用H2标签修饰。
作者简介:张落(1983一)女,北京人,项士学,工程师,研究方向:科技信息管理 25