OCRFlux is a lightweight yet powerful multimodal toolkit that significantly advances PDF-to-Markdown conversion, excelling in complex layout handling, complicated table parsing and cross-page conte…

Python 2,413 146 Updated Aug 4, 2025

tau-yihouxiang / EX-4D

The implementation of Extreme Viewpoint 4D Video Generation

Python 249 17 Updated Sep 6, 2025

winfunc / opcode

A powerful GUI app and Toolkit for Claude Code - Create custom agents, manage interactive Claude Code sessions, run secure background agents, and more.

TypeScript 19,284 1,486 Updated Oct 16, 2025

banodoco / Steerable-Motion

A ComfyUI node for driving videos using batches of images.

Python 959 51 Updated Oct 3, 2025

google-research-datasets / uicrit

UICrit is a dataset containing human-generated natural language design critiques, corresponding bounding boxes for each critique, and design quality ratings for 1,000 mobile UIs from RICO. This dat…

25 Updated Nov 19, 2024

soufiane001 / plop

Official code for PLoP

Python 15 4 Updated Jun 30, 2025

NVlabs / FeatSharp

Python 41 1 Updated Jun 25, 2025

nbardy / mcp-agent-communication

A TypeScript library for coordinating communication between multiple agents using the Model Context Protocol (MCP)

TypeScript 3 2 Updated Jun 28, 2025

chenguolin / DiffSplat

[ICLR 2025] Official implementation of "DiffSplat: Repurposing Image Diffusion Models for Scalable 3D Gaussian Splat Generation".

Python 456 27 Updated Aug 27, 2025

google-gemini / gemini-cli

An open-source AI agent that brings the power of Gemini directly into your terminal.

TypeScript 87,994 10,077 Updated Dec 19, 2025

VectorSpaceLab / OmniGen2

OmniGen2: Exploration to Advanced Multimodal Generation.

Jupyter Notebook 3,972 12 Updated Dec 2, 2025

voxel51 / fiftyone

Refine high-quality datasets and visual AI models

Python 10,156 693 Updated Dec 19, 2025

Yukun-Huang / DreamCube

[ICCV 2025] Official implementation of the paper "DreamCube: 3D Panorama Generation via Multi-plane Synchronization".

Python 161 11 Updated Dec 16, 2025

Abhinay1997 / RAS

Forked from microsoft/RAS

An open-source implementation of Regional Adaptive Sampling (RAS), a novel diffusion model sampling strategy that introduces regional variability in sampling steps

Python 7 Updated Apr 23, 2025

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Peter Baylies pbaylies

Achievements

Achievements

Block or report pbaylies

Stars

vivoCameraResearch / SDMatte

nvidia-cosmos / cosmos-xenna

Intelligent-Internet / CommonGround

GrigoryBartosh / sde_matching

deepbeepmeep / Wan2GP

BloopAI / vibe-kanban

haykgrigo3 / TimeCapsuleLLM

alibaba-damo-academy / Lumos

goombalab / hnet

alexiglad / EBT

chatdoc-com / OCRFlux

tau-yihouxiang / EX-4D

winfunc / opcode

banodoco / Steerable-Motion

google-research-datasets / uicrit

soufiane001 / plop

NVlabs / FeatSharp

nbardy / mcp-agent-communication

chenguolin / DiffSplat

google-gemini / gemini-cli

VectorSpaceLab / OmniGen2

voxel51 / fiftyone

Yukun-Huang / DreamCube

Abhinay1997 / RAS

tencent-ailab / SongBloom

docling-project / docling

kijai / ComfyUI-Lotus

EnVision-Research / Lotus

HigherOrderCO / Bend2-old

zjx0101 / ObjectClear