从网站索引的建立可预估网站的优化成果

2026-05-19

搜索引擎把页面抓回,下一步是对页面内容进行分析,主要包括确定页面类型、提取页面主题、去除页面噪声、去除停止词、中文分词、注册统计、重新建立关键词索引库。 判断页面是普通页面还是PDF、WPS、PPT、TXT等特殊页面;区分文本、图片、视频等内容形式,识别页面网站论坛、视频站、文本站等。 目前,搜索引擎基本不识别JS、AJAX、flash、图像、视频、帧和iframe框架结构的内容,主要是通过文本关键字抓取文本处理和搜索信息。提取页面级功能内容,如标题、关键字和说明...

阅读更多