process

2025-12-13 18:16

|

0

|

web自动化渗透

已经尝试做出第一版完全流程（其实就像是一个小实验）

包括大模型的API调用
提供给大模型的prompt (kali的渗透工程师要求只给出命令结合payload…)
抛给大模型整个漏洞页面
会话管理提供给大模型漏洞页面的token
插入人工干预可以对大模型给出的命令进行修改

当前效果

可以正常处理抛给大模型的页面信息
API调用也没问题
会话管理也OK
但是大模型给出的命令时好时坏绝大多数情况下对于渗透没有效果
大模型能够高效的给出各种常见渗透工具的命令
一些给出的命令kali根本用不了好像虽然确实是调用整个工具 kali里也有这个工具但是执行命令会给出错误应该是给出的命令的问题

按理说我用大模型打DVWA这种简单的靶场应该不会给错误命令但是为什么他给的命令有时候没有用呢是他没有定位到漏洞吗我已经把整个漏洞页面都给他了是我给的提示词不够准吗

一个sql注入的靶场我给他完整的漏洞页面正常来讲他如果定位到是sql注入那应该会给我sqlmap的命令但是他还是给了一些其他的命令 nikto curl等等甚至把我服务器一些信息都扒出来了(我靶场是服务器上用docker搭的啊不知道这正常吗)

~~ 我懂了他直接把我漏洞页面全扫了因为他有我服务器IP 我靶场搭在8080端口的 ~~

当前的问题

大模型给出的命令大多数无效 (我觉得可能是大模型的问题他不够专业针对这个问题可以考虑对大模型进行微调 fine-tuning 但是估计要喂不少数据)
只有一轮会话没有上下文信息(确实整个问题挺严重不可能一个漏洞大模型几句命令就一把梭了)
应该考虑大模型与用户交互光指望大模型不太行他不能一边根据回显一边调整命令等等这是个思路：不断的通过抛给大模型漏洞页面得到命令然后执行得到回显再抛给大模型这样一直循环直到得到想要的结果(比如getshell) 但是这个过程就要考虑大模型的记忆能力
虽然当前不会考虑资源的影响但是对用户的输入漏洞页面的信息命令执行后的回显等等各种数据信息有必要进行一些处理消除不必要的内容

在一次渗透过程中一般做法是扫端口根据端口情况对不同的端口有针对性地进行渗透利用一些工具构造payload等多种手段但是一般实际情况当中很少会去直接攻击80等这些常用难打的端口所以端口选择是一个问题这里插个眼后面解决

读pentestgpt论文的发现：

大型语言模型（LLMs）在执行端到端渗透测试任务方面表现出了能力，但在面对更复杂的测试目标时却遇到了困难。
大语言模型可以高效地使用渗透测试工具、发现常见漏洞并解读源代码以定位漏洞。
LLMs在保持长期记忆方面存在困难，而长期记忆对于有效地将漏洞联系起来并制定exploitation策略至关重要。
LLMs 更喜欢最近的任务和深度优先搜索方法，这往往导致对一个服务过度关注并忘记之前的发现。
LLM 可能会生成不准确的操作或命令，这通常是由内在的不准确性和幻觉引起的。

pentest gpt的做法：

PENTESTGPT 包含三个核心模块：推理模块（Reasoning Module）、生成模块（Generation Module）和解析模块（Parsing Module）。每个模块都保留一个 LLM 会话，以及与其相关的对话和上下文。用户可以与 PENTESTGPT 进行顺畅交互，不同的模块处理不同类型的消息。这一交互最终产生一个建议，即用户在渗透测试过程中应采取的下一步行动。

暂无评论

发送评论编辑评论

Markdown

悄悄话

|´・ω・)ノ

ヾ(≧∇≦*)ゝ

(☆ω☆)

（╯‵□′）╯︵┴─┴

￣﹃￣

(/ω＼)

∠( ᐛ 」∠)＿

(๑•̀ㅁ•́ฅ)

→_→

୧(๑•̀⌄•́๑)૭

٩(ˊᗜˋ*)و

(ノ°ο°)ノ

(´இ皿இ｀)

⌇●﹏●⌇

(ฅ´ω`ฅ)

(╯°A°)╯︵○○○

φ(￣∇￣o)

ヾ(´･･｀｡)ノ"

( ง ᵒ̌皿ᵒ̌)ง⁼³₌₃

(ó﹏ò｡)

Σ(っ °Д °;)っ

( ,,´･ω･)ﾉ"(´っω･｀｡)

╮(╯▽╰)╭

o(*////▽////*)q

＞﹏＜

( ๑´•ω•) "(ㆆᴗㆆ)

颜文字

Emoji

小恐龙

花!