欢迎来到尧图网

客户服务 关于我们

您的位置:首页 > 房产 > 家装 > python调用gemini2.0接口识别图片文字

python调用gemini2.0接口识别图片文字

2025/2/2 4:58:02 来源:https://blog.csdn.net/i_9420/article/details/144871619  浏览:    关键词:python调用gemini2.0接口识别图片文字
import os
import base64
import google.generativeai as genai# 配置 Google API Key
# 可以在系统环境变量设置 GOOGLE_API_KEY
GOOGLE_API_KEY = os.getenv("GOOGLE_API_KEY", "AIzaSXXXXXXXXXXXXXX")  # 替换成你的 API Key# 设置 Gemini 模型名称
model_name = "gemini-2.0-flash-exp"# 设置图片路径(这里使用一个在线图片URL)
image_path = "c:\\111.png"  # 替换成你的图片路径# 设置文本提示
prompt = "请提取图片上的文字返回"  # 修改为你需要的提示语def call_gemini_api(image_path, prompt, model_name, api_key):"""调用 Gemini API,并返回文本响应。"""# 配置 google.generativeaigenai.configure(api_key=api_key)model = genai.GenerativeModel(model_name=model_name)try:# 读取图片文件with open(image_path, 'rb') as f:image_data = f.read()except FileNotFoundError:print(f"错误:图片文件未找到:{image_path}")return ""# 将图片数据编码为 Base64 字符串base64_image = base64.b64encode(image_data).decode('utf-8')# 构建请求体contents = [{"parts": [{"inline_data": {"mime_type": "image/png",  # 假设图片为 JPEG 格式, 可根据你的图片类型修改"data": base64_image}},{"text": prompt}]}]try:# 发送请求并获取响应response = model.generate_content(contents=contents)response.resolve()if response and response.text:return response.textelse:return ""  # 请求失败或者没有文本except Exception as e:print(f"请求失败: {e}")return ""if __name__ == "__main__":response_text = call_gemini_api(image_path, prompt, model_name, GOOGLE_API_KEY)if response_text:print("Gemini API 响应:")print(response_text)else:print("调用 Gemini API 失败")

 识别结果跟图片

虽然有点小误差.但是可以接受.

GEMINI不给大陆使用.请自行想办法解决.

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com