日志文件中编码 URL 的含义

日志文件中编码 URL 的含义

一段时间以来,我一直在 Web 服务器日志文件中收到 URL 请求,但我不太明白它们是什么。例如:

GET /sample-url-1-%83%C6%92%C3%86%E2%80%99%C3%83%E2%80%92%C3%82%C2%A2%C3%83%C2%A2%C3%A2%E2%80%9A%C2%AC%C3%85%C2%A1%C3%83%E2%80%9A%C3%82%C2%AC%C3%83%C6%92%C3%A2%E2%82%AC%C5 HTTP/1.1
GET /sample-url-2-%83%C6%92%C3%82%C2%A2%82%AC%AC%C3%83%E2%80%9A%C3%82%C2%A6  HTTP/1.1

以上 2 个只是示例。还有很多变体。

当我尝试使用 Python 解码这些有趣的字符时,我只得到可能是非英语语言字符的有趣字符。

这些要求有害吗?如果有,该如何防范?

相关内容