O GitHub abriga um projeto fascinante chamado “Self-Operating Computer Framework” desenvolvido pela OthersideAI. Este framework revolucionário visa permitir que modelos multimodais, capazes de processar texto e imagens simultaneamente, controlem computadores como humanos. Imagine uma inteligência artificial que pode interagir com seu computador visualizando a tela, clicando em elementos e digitando informações – essa é a promessa do Self-Operating Computer.
Como Funciona?
O framework funciona conectando modelos multimodais, como GPT-4o, Gemini Pro Vision, Claude 3 e LLaVa, a um ambiente de simulação que replica uma interface de computador. O modelo recebe entradas visuais da tela e decide quais ações realizar, como clicar em botões, digitar texto ou abrir arquivos.
Aplicações Potenciais:
As possibilidades são vastas:
Contribuição para o Projeto:
O projeto é open-source e incentiva contribuições da comunidade. Desenvolvedores podem colaborar na melhoria do framework, adicionando novas funcionalidades ou modelos multimodais.
Se você se interessa por IA, aprendizado de máquina ou desenvolvimento de software, vale a pena conferir o Self-Operating Computer Framework no GitHub!
Meta notificou autoridades de que cerca de 20.225 contas do Instagram podem ter sido sequestradas…
Microsoft fechou junho de 2026 com o maior Patch Tuesday da historia: 206 CVEs, incluindo…
O GitHub anunciou que o npm versao 12 desligara por padrao a execucao automatica de…
CISA adiciona CVE-2026-42271 ao KEV: bug no LiteLLM da BerryAI vira RCE não autenticada quando…
Mid and South Essex confirma 2.380 registros comprometidos, somando-se aos 33 mil do Bedfordshire —…
Trend Micro confirma que Gamaredon (Earth Dahu) e SHADOW-EARTH-066 ainda exploram a CVE-2025-8088 no WinRAR…