【开源】访问任意URL并截图
本帖最后由 zdx0122 于 2024-11-1 13:21 编辑背景
之前看到国外有一个访问URL自动给截图的产品,看上去很简单,所以就编码实现了下,果然很简单,而且用chatgpt帮忙写了大部分的代码
演示
demo演示:https://screenshot.itest.ren/api/screenshot?url=http://52pojie.cn
替换掉url参数后的value为你想截图的网站域名即可
实现
1. 最核心的内容,就是使用playwright的headless模式进行访问URL并截图:
public CompletableFuture<File> takeScreenshot(String url) {
// 异步执行截图任务,提交到线程池
return CompletableFuture.supplyAsync(() -> {
// 创建一个新的页面
Page page = browser.newPage();
page.navigate(url);
page.waitForLoadState(NETWORKIDLE);
String modifiedUrl = url.replaceAll("https?://", "");
// 生成截图文件
Path screenshotPath = Paths.get("screenshot-" + modifiedUrl + "-"+ System.currentTimeMillis() + ".png");
page.screenshot(new Page.ScreenshotOptions().setPath(screenshotPath));
// 关闭页面
page.close();
return screenshotPath.toFile();
}, executorService);
}
2. 之后使用Controller暴露出来SpringBoot的服务
@GetMapping("/api/screenshot")
public CompletableFuture<ResponseEntity<byte[]>> getScreenshot(@RequestParam String url) {
// 异步调用 ScreenshotService
return screenshotService.takeScreenshot(url).thenApply(screenshot -> {
try {
// 将截图文件转换为字节数组
byte[] imageBytes = Files.readAllBytes(screenshot.toPath());
// 设置响应头为 image/png
HttpHeaders headers = new HttpHeaders();
headers.add(HttpHeaders.CONTENT_TYPE, "image/png");
// 返回截图数据
return new ResponseEntity<>(imageBytes, headers, HttpStatus.OK);
} catch (IOException e) {
return new ResponseEntity<>(HttpStatus.INTERNAL_SERVER_ERROR);
}
});
}
代码开源
完整代码已开源,可自行搭建部署:https://github.com/zdx0122/playwright-screenshot-api
欢迎交流和提idea,可迭代开发
如果是存在反爬的网站。playwright效果就没有那么好了,只能说其适合在常规的一些网站去做;
你上述实现的是将保存的截图保存到本地,给点建议:
1.添加可选项:将图片保存到OSS上;
2.保存的图片截图应该是截图所属网站平台+加上时间戳来描述其文件名称
最后,给你点个{:1_921:} 已经星标 zdx0122 发表于 2024-11-1 11:19
python也很容易写出来的,和Java差不多;
感觉不错的话,给仓库点个star呀,谢谢
果然是playwright{:1_921:} 这个小工具好呀,还代码开放了。赞 大佬,想问下这个产品有啥应用呢,感觉现在截图软件也都很方便 大佬这个要怎么使用呢?浏览器插件还是本机运行的小程序? 大佬可不可以搞全部下载的? 貌似提交的网页都是通过你的服务器去访问,会不会存在漏洞,比如别人提交的是一个挂马的网页? 这个使用场景是保存网页快照吗? 直接把网页下载下来是不是更好啊,礼貌咨询者的使用场景 楼主应该是给一个方法或例子,具体应用或产品还是要看各位小伙伴自己的。 wakawaka1024 发表于 2024-10-30 15:28
大佬,想问下这个产品有啥应用呢,感觉现在截图软件也都很方便
是国外有一个类似的产品,其客户是有大量截图很多网页的场景 abozhu 发表于 2024-10-30 15:33
大佬这个要怎么使用呢?浏览器插件还是本机运行的小程序?
是服务端运行的程序,用Java的SpringBoot写的web服务