一段时间以来,我一直在 Web 服务器日志文件中收到 URL 请求,但我不太明白它们是什么。例如:
GET /sample-url-1-%83%C6%92%C3%86%E2%80%99%C3%83%E2%80%92%C3%82%C2%A2%C3%83%C2%A2%C3%A2%E2%80%9A%C2%AC%C3%85%C2%A1%C3%83%E2%80%9A%C3%82%C2%AC%C3%83%C6%92%C3%A2%E2%82%AC%C5 HTTP/1.1
GET /sample-url-2-%83%C6%92%C3%82%C2%A2%82%AC%AC%C3%83%E2%80%9A%C3%82%C2%A6 HTTP/1.1
以上 2 个只是示例。还有很多变体。
当我尝试使用 Python 解码这些有趣的字符时,我只得到可能是非英语语言字符的有趣字符。
这些要求有害吗?如果有,该如何防范?