热搜:前端 nest neovim nvim

PHP的一些知识点研究(一)

lxf2024-01-18 20:24:01

一、基于PHP实现的webshell攻击

在乌云上看到一个基于php的webshell攻击。

高度隐蔽的webshell,使用普通的php代码将真正的shell内容经过层层加密处理之后保存到图片当中,只留下一个url,并且url还是经过加密处理的,所以对外看没有任何特征可寻,使其很难被发现,当打开上述url时,,显示的是404,而这个404页面就是伪装为404的木马,只是把标题改为了404 Not Found。

二、不用或少用else语句

对于if else 有人追求结构的完整,有if必有else,这看起来或许是不错,不过有时会带来代码的繁琐,而且可能会导致逻辑的混乱;可以以一种结果为基准,当发生其他情况时做if判断;即默认A,有异常则为B;如下面右图所示:

 

三、单页面结构(Single-page application)

单页面就是一切操作和布局都是在一个页面下进行,不需要页面跳转,根据不同的用户请求加载不同的内容。

优点:页面结构简单,数据量小,节省带宽,响应快,体验好,易于开发、维护以及优化;

缺点:使用ajax技术,导致不利于seo。

四、让搜索引擎抓取ajax的内容

主要针对上一案例的单页面结构,程序通过#结构url控制页面内容,但不会被搜索引擎抓取。

方法一:twitter使用"井号+感叹号"的结构,但体验不好而且繁琐;

方法二:使用History API;在不刷新页面的情况下,改变浏览器地址栏显示的地址。步骤如下:

A、用History API替代井号结构,让每个#号都变成正常路径的URL,这样搜索引擎就会抓取每一个网页。

B、定义一个JavaScript函数,处理Ajax部分,根据网址抓取内容。

C、定义鼠标的click事件,使用History对象的popstate事件处理浏览器的"前进 / 后退"按钮。

D、设置服务器端。

五、CURL_MULTI_INIT()

以前一直使用curl_init(),最近看到有curl_multi_init();本以为会带来更高效的代码,看了下curl_multi的步骤,感觉相当繁琐,而且curl_multi可能会造成cpu过高、网页假死等现象;同时对比了curl_init和curl_multi_init,多线程在速度上不一定优于单线程,多线程只是能在同时处理多任务,时间成本不一定低。附上curl_multi的使用步骤:

第一步:调用curl_multi_init;

第二步:循环调用curl_multi_add_handle;

这一步需要注意的是,curl_multi_add_handle的第二个参数是由curl_init而来的子handle;

第三步:持续调用curl_multi_exec;

第四步:根据需要循环调用curl_multi_getcontent获取结果;

第五步:调用curl_multi_remove_handle,并为每个字handle调用curl_close;

第六步:调用curl_multi_close。

六、PHP strstr()函数

strstr(string,search)搜索一个字符串在另一个字符串中的第一次出现。返回字符串的其余部分(从匹配点)。如果未找到所搜索的字符串,则返回 false。


search 必需。规定所搜索的字符串。如果该参数是数字,则搜索匹配数字 ASCII 值的字符。

参考:http://www.w3cschool.cn/func_string_strstr.html。所以,在给第二个参数时,如果需要匹配数字,建议加上引号。

七、论规范化的重要性

家附近的一条久治不下的道路,通过划分出人行通道、非机动车道、机动车道,使得问题一下子等到了解决。有时候灵活导致选择过多,问题也会很多;程序亦如此,用户输入的灵活看起来很不错,其实在后台处理时是需要更多的成本,何不在前期就进行规范化,bug止于源头,而不是亡羊补牢。规范化使一切流程变得简单高效。

八、HHVM

HHVM (HipHop Virtual Machine)会将PHP代码转换成高级别的字节码(通常称为中间语言)。然后在运行时通过即时(JIT)编译器将这些字节码转换为x64的机器码。

从各项数据表明,和Zend相比,HHVM变得更高效,CPU负载降低,平均页面加载时间也缩短。HHVM的存在是为了优化PHP运行性能,和php5相比,确实存在一些优势,还是坐等php7吧。

九、PHP源码签名收集器

当学习新的、不熟悉的源码时,对代码结构获取直观的感受是很重要的。可以通过从每个源文件中逐行获取标点进行总结,即文件签名。这可以帮助考量代码的复杂度。其实也就是提取代码文件中固定的符号呈现文件的结构。

参考:http://c2.com/doc/SignatureSurvey/

十、协同过滤推荐算法

1、基于内容的推荐算法的前提假设是:如果用户喜欢物品a,那么用户也应该会喜欢与a类似的物品。基本思想是拆分内容属性,提取相同属性的内容进行推荐。

2、协同过滤推荐算法的前提假设是:如果用户a与用户b均对一系列相同的物品表示喜欢,那么a极有可能也喜欢b用户喜欢的其他物品。基本过程是用户首先为每个item进行评价打分,通过计算不同用户评分之间的相似程度,可以找到最近邻居,根据最近邻居的评价,产生推荐。

上述算法都是运用了矩阵建模,使用到余弦相似度、皮尔逊相似度等公式。使用中可将二者合二为一推荐。