程序员看了会沉默:我靠聊天就让AI写出了手势交互系统!TensorFlow.js模型实战!
小伙伴们,最近在刷抖音时看到了一个好玩的编程点子,通过摄像头获取手的姿势模仿抓取物品的小程序,当时想着如何通过AI来实现。今天我们就来尝试着通过一张截图来不写一行代码来实现这个功能。
截图分析需求:
抖音视频截图如下:

如何制作当前相似的功能呢,要自己写提示词,不存在的,我们利用豆包的图片理解能力分析出当前功能并给出相应的AI编程提示词。
打开豆包,上传截图输入提示词:

开发如下功能给出提示词
豆包给出了相应的提示词
我要开发一个浏览器端应用,功能是用 TensorFlow.js 实现“手势抓取虚拟物品”。具体需求:1. 调用摄像头,通过 TensorFlow.js 加载手部姿态检测模型(类似 MediaPipe Hands 能力),实时输出手部关键点、手势状态(是否检测到手、手掌开合度等)。2. 在页面中用 Canvas 或 HTML 元素渲染虚拟物品,当手势满足“抓取条件”(比如手掌闭合、关键点覆盖物品区域)时,物品跟随手势移动。3. 需处理摄像头权限、模型加载失败等异常,还要优化性能(避免推理卡顿、交互延迟)。希望你能指导:- TensorFlow.js 手部模型选型(比如推荐适合浏览器端、轻量且精度足够的模型)及加载、推理的代码流程。- 手势“抓取判定”的具体算法逻辑(如何映射坐标、判断交互条件、处理物品跟随)。- 前端界面(摄像头预览、交互区、状态提示)与 TensorFlow.js 结合的实现要点。- 性能优化的关键手段(比如帧处理策略、模型推理异步化)。麻烦从技术方案框架、核心代码片段(或伪代码)、易错点提醒(如跨域、坐标转换问题)等方面详细说明,感谢!
将提示词丢给claude 开始编码

Claude给出了Todos 待办事项

我们一路Yes等待claude的自动编码

claude完成了相应的编码

我们来运行程序看下效果

提示正在加载模型,我们来优化用户第一次打开就下载模型,后续直接本地加载模型这样用户的体验感会好很多
项目优化:
输入提示词:
优化项目,第一次打开程序自动下载相应的模型到当前项目目录中,下载完成后进行模型的加载

优化完成

继续优化将界面分为左右两部分,左边为摄像头反馈,右侧为交互区域,输入提示词:
优化界面 左边为实时摄像头反馈 右边交互区域,可通过手势抓取物品

优化完成


项目调试:
接下来就是调试过程了,在我们测试的过程中如果遇到问题了我们就直接对话让claude进行优化。

之前模型有些问题我们去官网看下文档,翻阅下TensorFlow.js 对应的文档!

选择手部姿势检测

找到模型路径:https://cdn.jsdelivr.net/npm/@mediapipe/hands


对当前的模型进行优化
优化代码,物品区域的物品不要晃动,手势优化 https://cdn.jsdelivr.net/npm/@mediapipe/hands显示20个节点,抓取物品后开始移动物品,张开手释放物品停留在原处

优化完成


最后再做一些小小的优化
在手势移动到物品的位置有一个反馈,提醒用户这个物品被触碰了,等待抓取。

优化完成


