网络爬虫合法性案例 — 抓取客户手机号!

之前我写过关于网络爬虫合法性的简单介绍,传送门:http://www.rrdaj.com/hzseo/3263.html,今天看到一篇关于采集用户手机信息的案例性文章,觉得还不错,整理过来让大家看看: 一、淘宝、京东等多家网站数据被爬取 2019年7月底,新京报记者卧底“鹰眼智客”发现,其实际上是利用爬虫技术,从淘宝、京东等网站上爬取到店家手机号后,用于营销。此外,借助该软件,通过微信附近的人,用户可任意设定虚拟位置后批量申请好友,还能“站街”钓鱼营销。 记者发现一家名为“鹰眼智客”的大数据公司

个人如何做跨境电商之避免外贸纠纷!

看到“纠纷”,都是大家很头疼的事儿,现在就给大家支几招儿-“怎么避免纠纷”。现在外贸都不好做,我们也可以体会到各个卖家的难处,但是无论做什么事情,我们大家都应该,也必须要做的一件事,就是:做准备、做好充分的准备。 现在就开始第一招:了解国际计量单位。 国际上的计量单位,目前本人了解到的有:piece,lot,dozen,set 等单位,每个单位都是不同的意思,一定不可搞混,之前遇到过有些seller在描写产品时写到:12dozen/lot,这样的写法, 就代表:1个lot里 有12个dozen的

【转载】WordPress教程– 常用文章查询调用语法大全

WP_Query 类是 WordPress 文章查询的核心,它的文章查询部分提供了很多可用参数,经过好几个版本的升级完善,让它越来越强大,本文就可以让你详细的了解所有查询参数和技巧。     作者   查询和某些作者(用户)有关的文章,可以使用 4 个参数: author(整数):用户 ID author_name(字符串):用户的昵称(“user_nicename” 字段) author__in(数组):用户 ID author__not_in(数组):用户 ID

网站运营最新–WordPress SEO 插件推荐!

今天主要给大家安利一些 wordpress 开源程序 SEO 插件,因为由于我们并不是专于后端,加上个人站长精力有限,所以需要一个 SEO 插件来辅助我们得工作,市场上得插件很混杂,我就列几个我用过得来说一下,大家自行选择一个就好了,不需要多个,不然会引起功能冲突!   插件怎么去选择呢?   我个人是从功能性来去看,就是说这个插件能给我当下得网站带来什么样的好处,而不是看插件界面好不好看,功能多不多,这个很重要,就像我们买衣服,也不能只看它外形,更要看它实用性,布料,搭配等

SEO 渠道的小秘密–什么是精选摘要?

当你在谷歌或者百度搜索引擎中提出问题或使用某些特定的关键词进行搜索时,可能会出现一个特殊的信息板块,大概是下图这样的效果:           什么是精选摘要?   精选摘要一般来自网页搜索结果,谷歌/百度的自动化系统会查看网页搜索结果,并确定突出显示其中某条结果对用户来说是否实用。对于以问题形式表述的搜索查询,系统尤其可能显示精选摘要。搜索引擎的搜索结果有时会将网页的摘要显示在网页链接之前,而不是按照标准格式显示在网页链接之后。以这种

Chromium

【谷歌产品】Chromium vs Chrome 的区别是什么 | 怎么选择

往往现在我们大多数人都知道谷歌 Chrome 浏览器,甚至用它作为默认的浏览器,但是我们并没有真正了解还有一个 Chromium 浏览器。根据名称来看,很容易推断两者是以某种方式联系的!Chrome 是一款由谷歌开发和发布并广受欢迎的web浏览器,而 Chromium 是 Chrome 浏览器的原始版本,也就是说他们之间是父与子的关系,Chrome 基于 Chromium 之上,但是,Chrome 和 Chromium 又有很多差异。实际上,Chrome 使用与 Chromium 相同的源代码,

网站运营 & APP大数据分析师需要了解的知识!

作为一个网站分析师或移动端APP分析师,通常会有四个主要任务: 发现趋势并整理数据报告。 分析线上营销的获取策略,并挖掘新的机会和/或者新的策略。 理解线上(和/或者应用端上)访客的行为和体验。 持续跟踪趋势与细节。   三个步骤 为了完成这四个主要的任务,网站分析师和/或者移动端分析师一般需要经历以下三个步骤。 数据收集 – 收集存储用于生成报告的原始数据。 数据报告 – 处理原始数据,呈现作为分析报告的数据。报告可能是表格或者图形或者两者兼而有之。 数据分析 – 仔细检查数据报告,

【数据说故事】SEO商业网站速度性能运营优化-指南(二)

网站性能–作为在线商务最重要和最有力的互联网指标,就是因为转化率全面依赖于网站 kpi,而KPI的成功与否正是由自己的产品性能相关,以此建立在线零售平台的竞争优势。 再给大家说个小故事,我记得以前看过一个新闻:就是奥巴马在2011年总统大选期间进行了筹款活动,该活动筹集了大约3400万美元,有报道证实当时奥巴马政府为美国互联网网站的页面加载时间整体从5秒缩短到2秒——这就意味着捐款转化率增加了14% ,而这些额外的钱正是归功于网站性能3秒的提升!   网站性能怎样影响用户的

【数据说故事】SEO商业网站速度性能运营优化-数据指南(一)

网站性能优化也是 SEO 优化至关重要的一环,技术优越的商业网站优化设计是决定现代在线商务成功的主要因素。毕竟,当用户等待加载速度慢的网页,都会选择另一家公司服务,包括浏览网站,付款结算等交互行动,SEO 运营差的网站就会被竞争对手压制扼杀——这就是商业竞争!所以网站速度速度某种程度上就是卖点! 在下面的指南中,我将简单说一些技术细节,篇幅较长,需耐心阅读,都是自己阅读了很多文档以及自己的一些小建议,纯属个人观点,有更好的建议,大家也许可以一起多多交流! 快速的页面加载速度增强了访问者的参与度,

广告拦截插件会影响Google analysis

广告拦截插件影响Google analysis网站流量分析报告的真实性

首先直接给大家答案吧:广告拦截插件或者软件不仅仅会阻止广告,它也会屏蔽大多数分析工具所使用的跟踪信标,如谷歌分析、Adobe Analytics,百度统计等工具。记得以前看过一篇文章,优化咨询公司 Quantable去年发布了一个很有趣的实验结果,用来测量阻碍 Google Analytics 的网站流量。他提供7个广告拦截扩展的分类,以及他们是否默认阻止了 Google 分析。他的实验发现,11% 的网站访问者确实屏蔽了谷歌分析等网站分析工具的js跟踪代码。   我在一个网站最近出现

【移动端SEO速度篇】怎样提高自己网站的服务器响应时间!

  什么是服务器响应时间呢?服务器响应时间是可以简单理解为 web 服务器到浏览器请求响应所需的时间。就SEO而言,响应速度对于移动端还是很重要的,比如谷歌官方宣称”网页应该将服务器响应时间减少到200毫秒以下”是必要的,百度其实也差不多。     决定移动端服务器响应时间的四个主要因素:   网站流量   网站资源使用情况   网络服务器配置情况   网络托管     一、网站流量如何影响服务器响应时间?   其实这个最好理解,打个比方吧:就像肯德基

【SEO教程】robots.txt协议的作用以及怎么编写问题!

       robots.txt 文件首先它是一个简单的文本txt文件,也被称作协议文件,它指定搜索引擎爬虫是否应该或者不应该访问特定的文件夹、子文件夹或者页面,以及关于你的网站的其他信息,该文件作为一个用于网站与爬虫和其他机器人进行交流的一个媒介。当然使用协议文件是绝对必要的: 你可以使用 HTML 或者文字编辑器创建一个 robots.txt 文件,然后把包括禁止搜索引擎爬虫爬取的文件位置的代码写进去放到网站根目录即可。     robots.txt 是如何工作的?原理是什么?

【网站运营交流贴】第一方和第三方cookie是什么以及区别

今天的论题是cookie的作用及cookie 的分类。首先cookie是追踪访问者行为中的重要一环,在所有的检测系统和追踪工具中想是不可或缺的。cookie最初的作用并不是用来追踪访问者行为,而是网站用来记录访问者的用户信息、历史记录、访问偏好,以及判定老访客的登录状态,并且通过这世信息提升访问者在网站的使用体验。例如,新访客并不需要每次都以用户名和密码进行登录操作;在访问淘宝时,可以看到上次浏情的商品信息。这些都是依靠Cookie中存储的信息如果将浏览器中所有Cookie都清空,再访问经常光顾

【6.1网站日志分析教程心得】垃圾流量和蜘蛛机器人一直在你的Google analysis中显示?

  谷歌分析(Google analysis)中有一个强大的内置过滤器功能,有助于防止垃圾邮件、机器人和其他破坏数据完整性的垃圾流量。然而,我经常发现那些不使用这些工具的网站,或者他们使用这些工具的网站,任然出现这些垃圾流量,形式奇形怪状,原因有哪些呢?   为了获得准确的数据,避免浪费你的时间,出现分析错误,今天就简单的说一下如何有效地处理分析中的不同类型的垃圾流量。   谷歌分析中的垃圾信息可以分为两种类型: ghosts and crawlers   1、Ghosts   大多数垃圾邮件都

【网站日志分析教程心得】Apache Logs vs. NGINX Logs说什么以及作用分享

  访问log日志对于理解如何优化 Web 服务器和网站SEO是至关重要的。事实上,当涉及到网络开发中的缺陷诊断时,日志记录是可以在问题发生之前,你就可以采取最重要的行动来弥补的一个重要数据集。这就是为什么知道如何使用 Web 服务器的访问日志的原因—这也是本文的主题,它涵盖了 Apache 日志和 NGINX 日志(ISS这篇暂时不说)。 根据2017年的 Sumo Logic Modern Application 报告,这两个 web 服务器在亚马逊服务器中( AWS) 中都被广泛使用。因此

【5.16网站流量运营日记】运营推广-utm参数的作用以及应用

  这篇文章的内容是如何使用 UTM参数有什么作用,以及来确保你获得的流量在网站流量分析中(Google analysis)能正确显示来源。当一个人访问你的网站时,他们的浏览器会读取底层的 HTML 和 CSS 代码,以便知道在浏览器中应该显示什么。如果你安装了谷歌分析,这个代码的一部分就是在浏览器加载网站时执行的谷歌分析js脚本。这个代码可以做很多事情,其中之一就是解释访问者是如何在网站上开始和结束的。 这是通过检查他们的行为在哪个 URL或者页面屏幕来完成的。这就被称为 referrer U

【Google/百度 seo教程】什么是meta标题标签?怎么去写mete-title标签

  mete-title是指指定网页标题的 HTML 元素。标题标签显示在搜索引擎的搜索结果页面(SERPs)并作为一个结果的可点击标题,并且对于可用性、SEO和社会分享都很重要。网页的标题标签意味着一个页面内容是否精确和描述是否简洁。       谷歌/百度通常会显示标题标签的前50-60个字节。所以最佳的写法我建议是这样的:   主关键字-次要关键字|品牌名   例如:8-foot Green Widgets – Widgets & Tools | W

【谷歌seo教程】如何使用python和cmd从命令行批量检查url的HTTP状态码

  本教程讲述如何使用python从命令行批量检查 一个网站的url HTTP 状态代码, 为此,我将使用一个txt链接或 VL 的python 库以及免费cmd命令行工具来实现它。首先它需要一个包含 url 列表的txt文件作为命令行参数。之后,python开始执行脚本后会开始逐一检查它们。同时,在检查了这些 url 之后,它会输出txt上的 HTTP状态码。这个工具不仅可以列出状态代码,还可以自定义该命令来使用该工具的更高级特性,例如忽略某些状态码,添加自定义超时,指定每次请求的数量等等,此

【杭州外贸推广篇】AI人工智能与外贸推广的营销大方向

  AI人工智慧的话题,伴随着机器学习的能力增强不断炒热,AI应用在各个行业层面越来越广泛,数位营销和电商当然早就是AI密集使用的行业,你的搜寻引擎优化SEO背后就是机器运用演算法推送最优结果,还有FB或Amazon广告的投放也是AI在背后不断学习优化。然而作为需要不断发想新内容的营销人员,将AI人工智慧的应用在营销产业上的趋势可说是锐不可挡,其中又属聊天机器人目前最火热。   但是除了聊天机器人之外,一个好的人工智慧辅助工具,还能帮助营销人员完成更多自动化的内容,并且协助你更迅速地完成工作项目

【Facebook推广技巧】如何使用 SHOPLINE+FACEBOOK 广告提升网站转化率

  之前看过台湾的一位行销人员的案例,有点关于Facebook推广营销技巧的看法,各位看官看看就好。大家也都知道台湾的鞋业发展的早,品质备受国际认同,但不敌生产更低成本的地区和fast fashion造成的消费习惯改变。比起职人品质,消费者似乎更习惯“又新又快、用完即烂”,也让脚患的年龄层逐渐年轻化。台湾的品牌思维和行销力也普遍不成熟,他认为“一个大家让看不到的东西不能称为好东西”。他起先,是被一篇文“为何都是东南亚人like他”所吸引。这个问题曾经让他认为fb广告根本垃圾,当时的他也如同大部分