NGINX Ubuntu 安装优化以及常见问题集锦

一、ubuntu安装nginx 1.更新源 2.安装nginx 3.配置nginx nginx配置文件主要分为六个区域: main 控制子进程的所属用户/用户组、派生子进程数、错误日志位置/级别、pid位置、子进程优先级、进程对应cpu、进程能够打开的文件描述符数目等events 控制nginx处理连接的方式http http服务sever 主机设置location url规则upstream 负载均衡 进入配置文件 配置文件信息如下: 二、nginx常见问题总结 1.ip限制 http 字段加

搜狗总是不收录网站或者只收录首页问题

在一家公司任职,发现网站百度、360、谷歌都已经收录上千了,神马和必应也收录了几百,唯独搜狗最不给面子,一个页面都没有收录。 你可能会说,毕竟搜狗的份额少,能带来的流量不多,重视百度就行了。但对于一个公司的站点来说,除了流量,网站的权威、品牌还是很重要的,如果一个用户无法在搜狗上搜索到公司的官网,他不会觉得这是搜狗的问题,只会在潜意识里觉得这个公司不咋样。 先说下搜狗不收录网站的表现: 收录量(在搜狗这里指的是抓取量)不多,索引量要么是1,要么为 没有任何的关键词排名,带不来任何流量 抓取频次很

网站刷流量之–百度统计出现别人的网站和异常关键词

最近,我发现我的站点经常被人打广告,操作手法就是利用一些软件在我的百度统计账号里面进行广告植入,进而让你好奇点进他的站点,从而实现他网站推广信息的展现, 以及流量的提高! 攻击者有可能是行业同行让团队操作的,SEO同行,或者是那些卖服务的商家…..当然这些多半发生在百度统计,像谷歌我遇到的不是很多,可能百度在这块做的不是很好,效果如下: 从上图可以看出,这些操作基本上都是软件导致的,很密集,很频繁,而且关键词大部分都是卖seo、服务器、蜘蛛池,收流量,收ip等与黑帽业务有关的一些人员

搜索引擎原理–搜索算法的工作方式(以Google为例)

网络上的信息繁多庞杂,如果不借助一些服务对信息进行整理和排序,要找到您需要的内容会如同大海捞针。Google 排名系统旨在实现这一目标:它们会对 Google 搜索索引中的数千亿个网页进行整理和排序,以便瞬间找出最相关、最实用的结果,并将这些结果以一种有助于您查找所需内容的方式呈现出来。   这些排名系统由一系列算法组成,而不是一个算法。为了向您提供最实用的信息,Google 搜索算法会考虑很多因素,包括您查询的字词、网页的相关性和可用性、来源的专业度,以及您所在的位置和您采用的设置。

购买ADSL拨号VPS服务器遇到的坑—— 云立方&淘宝卖家!

之前看过类似的帖子,发出来分享下…….做爬虫的同学不可避免地要使用代理IP,除了各网站公布的免费代理IP外,我们还可以选择拨号VPS,本文简单对两家(类)拨号VPS提供商进行测评,如有差错,欢迎指出,非常感谢。     使用过程 云立方 第一次听说云立方是在崔庆才的博客,大V推荐的、并且还亲自试用了,应该没有错,因此购买了他家的最低配110元每月的机器。     云立方配置 付款后几分钟(< 5)就可以登陆,登陆后安装完epe

【SEO基础干货】百度搜索引擎工作原理解析!

Spider 抓取系统的基本框架   互联网信息爆发式增长,如何有效的获取并利用这些信息是搜索引擎工作中的首要环节。数据抓取系统作为整个搜索系统中的上游,主要负责互联网信息的搜集、保存、更新环节,它像蜘蛛一样在网络间爬来爬去,因此通常会被叫做 “spider”。例如我们常用的几家通用搜索引擎蜘蛛被称为:Baiduspdier、Googlebot、Sogou Web Spider 等。   Spider 抓取系统是搜索引擎数据来源的重要保证,如果把 web 理解为一个有向图,那

如何获取 Google 附加链接功能(Google Sitelinks)

网站附加链接功能可能大家还不知道这个术语,其实我们经常见到,只是没注意这个功能,在谷歌叫 Google Sitelinks,它是一个以列表形式呈现一个品牌词的搜索结果,然后由多个站点链接组成,一般数量是2-6个。大多数网站运营商都将附加链接视为一种提高企业声誉形象途径,并且还是一种扩大搜索结果页面区域的方式。所以由于这些原因,附加链接很有商业价值,目前百度也有类似功能,但是很少呈现。         上图是一个附加链接列表的示例,在Google主搜索结果下

SEO案例研究

如何利用SEO帮助旅行型网站增加销售额 (SEO案例研究)

今天说的这家 www.Dovolenka.sme.sk 是一家旅游型的交易网站,类似咱们的携程,它主要为斯洛伐克和奥地利游客安排国外目的地旅游等业务。这家网站的SEO基础其实是不错的,只是当初乙方的的第一建议是重新设计版面,因为版面不好交互而且显得杂乱,没有大公司该有的气魄!所以为什么设计和SEO有着千丝万缕的联系,就是咱们说的交互问题,外观好看不好看次之,这另说,但是交互不行,跳出率肯定是高的,跳出率一高,SEO水准自然也就慢慢下滑,这是必然的。     这个网站SEO关键

【转】代理服务器(代理IP)的入门与简介

一、什么是代理服务器 代理IP即代理服务器,英文全称是Proxy Server。其功能就是代理网络用户去获取网络信息,形象的说,它是网络信息的中转站。 一般情况下,我们使用浏览器直接连接目标Internet站点获取信息,然后由目标站点服务器直接把信息传回。代理服务器则是介于客户端和Web服务器之间的另一台服务器,有了它之后,浏览器不是直接到目标站点获取信息,而是向代理服务器发出请求,由代理服务器从目标站点取回所需要的信息,最后再传递给客户浏览器。大部分代理服务器都具有缓冲的功能,像一个大Cach

【转】linux系统扫描技术篇之nmap的使用优化!

发现这篇文章写得蛮详细的,分享出来,关于优化nmap的性能(目的是加快速度,提高准确性)(扫描方法:分步骤,原文:https://boke.wsfnk.com/archives/154.html),当然nmap的使用众说纷坛,大家可别用它做坏事啊……..     第一:快速判断是否在线(UDP和TCP不要同时进行) nmap -sP -n 117.169.17.1/24 #非常快速,速度与fping相差无几 第二步:控制扫描的端口,默认nmap扫描10

抓取频次

【搜索引擎优化原理】SEO 抓取频次 VS 抓取预算的简单介绍!

之前我写过网站收录下降的不同原因中,就提过抓取这个概念(传送:http://www.rrdaj.com/hzseo/seoxin-shou-ru-men-xue-xi/3072.html),不同类型的网站上的内容千差万别的,比如电商网站,如淘宝,就有大量的产品链接;内容输出型如:CMS,会有大量的文章单链接;论坛交互型。如:知乎,它是含有大量的评论回复链接,那么,搜索引擎蜘蛛在抓取时,应该也是区别对待的,怎么抓,抓多少,这就是‘抓取预算’的概念了,这个在国内叫抓取频率,它是由 Google 提出

酒店seo策略

【互联网那些事】酒店 SEO 网站运营案例策略 !

搜索引擎优化策略也根据不同行业垂直市场的不同而不一样,所以今天,把之前我看到的爱尔兰、英国以及其他地方有一些酒店集团网站的案例简单分享一下,个人觉得挺有趣的。我们将看看酒店行业搜索引擎优化的一些关键考虑大局因素,这些因素也是你应该考虑的——它们可能决定你的 SEO 成功的关键,这些观点仅代表个人看法,大家可以参考参考,欢迎交流。   我们如何优化酒店行业的网站结构? 酒店集团通常会遇到这种令人头疼的问题——特别是项目刚开始网站搭建或者网站改版,方向在哪。我们要不要改变我们之前的 SEO

【数据说故事】SEO商业网站速度性能运营优化-数据指南(一)

网站性能优化也是 SEO 优化至关重要的一环,技术优越的商业网站优化设计是决定现代在线商务成功的主要因素。毕竟,当用户等待加载速度慢的网页,都会选择另一家公司服务,包括浏览网站,付款结算等交互行动,SEO 运营差的网站就会被竞争对手压制扼杀——这就是商业竞争!所以网站速度速度某种程度上就是卖点! 在下面的指南中,我将简单说一些技术细节,篇幅较长,需耐心阅读,都是自己阅读了很多文档以及自己的一些小建议,纯属个人观点,有更好的建议,大家也许可以一起多多交流! 快速的页面加载速度增强了访问者的参与度,

【移动端SEO速度篇】怎样提高自己网站的服务器响应时间!

  什么是服务器响应时间呢?服务器响应时间是可以简单理解为 web 服务器到浏览器请求响应所需的时间。就SEO而言,响应速度对于移动端还是很重要的,比如谷歌官方宣称”网页应该将服务器响应时间减少到200毫秒以下”是必要的,百度其实也差不多。     决定移动端服务器响应时间的四个主要因素:   网站流量   网站资源使用情况   网络服务器配置情况   网络托管     一、网站流量如何影响服务器响应时间?   其实这个最好理解,打个比方吧:就像肯德基

【广告运营贴】SEM广告系列中的恶意点击的那些事!!

        今天和大家分享下关于百度/Google SEM 竞价恶意点击的一些小建议,纯属个人见解!不喜勿拍!我相信很多做百度/谷歌竞价的朋友都有注意到你的广告预算在某个时间段正在比平时消耗得更快更多?但是呢,你的转换率却下降了,订单并没有增长。看起来流量上升了很多,点击数额很大很开心,这个时候,你就得小心了,因为你很可能成为恶意点击的目标了,并可能成为点击机器人的点击农场。毫无疑问,欺骗性的机器人点击是无声的预算杀手,它存在于整个seo和sem领域,很令人头疼,不管是国内的百度还是国外的谷

【Google analysis教程分享】GA出现Not Provided 和others?

       大多的我在运营工程师或者SEOer们在分析数据的时候难免会遇到一个问题,就是谷歌分析让他们无法完整的看到自然搜索keywords数据报告,总是显示Not Provided 和others。在这部分分析中,越来越多的结果被隐藏——当你试图找出用户在搜索什么时,没有太多的数据可看,例如下图:   为何隐藏Not Provided 和others数据呢?   其实早在2011年10月,谷歌就改变了从搜索中收集数据的方式,这样来保护用户的隐私。如果你在搜索时已经注册了 Google,那么你

【网站日志分析教程心得】Apache Logs vs. NGINX Logs说什么以及作用分享

  访问log日志对于理解如何优化 Web 服务器和网站SEO是至关重要的。事实上,当涉及到网络开发中的缺陷诊断时,日志记录是可以在问题发生之前,你就可以采取最重要的行动来弥补的一个重要数据集。这就是为什么知道如何使用 Web 服务器的访问日志的原因—这也是本文的主题,它涵盖了 Apache 日志和 NGINX 日志(ISS这篇暂时不说)。 根据2017年的 Sumo Logic Modern Application 报告,这两个 web 服务器在亚马逊服务器中( AWS) 中都被广泛使用。因此

【5.20网站运营教程笔记】新手怎样用R语言连接并分析MySQL数据库

如果你想以一种结构化、可视化的方式从数字历史项目中存储和处理大数据,这篇文章就是介绍怎样用R 语言在不使用关系数据库的情况下执行分析、处理数据存储的问题。我将使用一个名为 MySQL 的数据库来存储数据来举例子,前提是你必须熟悉MySQL的安装和使用,以及R语言的安装和使用。   首先确保你有最新版本的 MySQL(百度有教程怎么安装),以及最新版本的 r 安装(百度有教程怎么安装),在这里我推荐使用 RStudio。从 RStudio 你可以安装 MySQL 包: install.packag

【5.14 GTM教程】如何用 Google Tag Manager标签管理器设置GA onclick按钮点击事件

  首先这种设置有一个条件,就是你不熟悉开发者技术,或者公司技术人员不了解google analysis的原理,那么这个时候使用 Google 标签管理器(GTM)来跟踪按钮onclick点击事件是最佳的选择了。如果你使用的开源插件没有给你添加跟踪设置的选项,那么同样可以使用gtm来布置。     开始之前你需要创建一个 GTM 账户(这个我就不多说了),在你的网站上安装 GTM代码。onclick这种情况其实并不常见,代码必须是这样的类型: