Spaces:
Paused
Paused
File size: 12,296 Bytes
fb56537 |
|
# aduc_framework/engineers/deformes4D.py
#
# Versão 16.0.0 (Integração de Lógica ADUC-SDR Canônica)
# Copyright (C) August 4, 2025 Carlos Rodrigues dos Santos
#
# - Refatora a lógica de geração de vídeo monolítica para o padrão de
# Especialista ADUC, operando dentro da classe Deformes4DEngine.
# - Integra o núcleo lógico de Poda Causal, Eco e Déjà-Vu (linhas 187-315
# do arquivo original) de forma intacta.
# - Substitui as chamadas de baixo nível por delegações aos managers
# especializados (VaeManager, LtxManager, VideoEncodeTool).
# - O método principal agora aceita um `VideoGenerationJob` do Planner5D.
import os
import time
import torch
import logging
from PIL import Image
import gc
from typing import Dict, Any
# Importa os managers e especialistas da arquitetura ADUC
from ..managers.ltx_manager import ltx_manager_singleton
from ..managers.vae_manager import vae_manager_singleton
from ..tools.video_encode_tool import video_encode_tool_singleton
from ..types import LatentConditioningItem, VideoGenerationJob
from ..engineers.composer import composer_singleton as Composer # Usado para decisões cinematográficas
logger = logging.getLogger(__name__)
class Deformes4DEngine:
"""
Implementa a Câmera (Ψ) e o Destilador (Δ) da arquitetura ADUC-SDR.
É responsável pela execução da geração de fragmentos de vídeo e pela
extração dos contextos causais (Eco e Déjà-Vu).
"""
def __init__(self):
self.workspace_dir: str | None = None
self.device = 'cuda' if torch.cuda.is_available() else 'cpu'
logger.info("Especialista Deformes4D (Executor ADUC-SDR: Câmera Ψ e Destilador Δ) inicializado.")
def initialize(self, workspace_dir: str):
if self.workspace_dir and self.workspace_dir == workspace_dir:
return
self.workspace_dir = workspace_dir
os.makedirs(self.workspace_dir, exist_ok=True)
logger.info(f"Executor de Cena 4D inicializado com workspace: {self.workspace_dir}.")
def _quantize_to_multiple(self, n, m):
if m == 0: return n
quantized = int(round(n / m) * m)
return m if n > 0 and quantized == 0 else quantized
# O método principal que o Planner5D chamará
def generate_movie_clip_from_job(self, job: VideoGenerationJob) -> Dict[str, Any]:
if not self.workspace_dir:
raise RuntimeError("Deformes4DEngine não foi inicializado.")
# Extrai os parâmetros da Ordem de Serviço
keyframes = job.keyframe_paths
global_prompt = job.global_prompt
storyboard = job.storyboard
seconds_per_fragment = job.duration_per_fragment
trim_percent = job.trim_percent
handler_strength = job.handler_strength
destination_convergence_strength = job.destination_convergence_strength
video_resolution = job.resolution
# Este método agora encapsula a lógica do seu 'generate_full_movie'
return self._execute_generation_logic(
keyframes, global_prompt, storyboard, seconds_per_fragment,
trim_percent, handler_strength, destination_convergence_strength,
video_resolution
)
def _execute_generation_logic(self, keyframes: list, global_prompt: str, storyboard: list,
seconds_per_fragment: float, trim_percent: int,
handler_strength: float, destination_convergence_strength: float,
video_resolution: int):
#####(atenção Gemini .. nao apagar ou modificar nada apartir dessa linha) #####
# manter o conteudo original da linha 187 ate 315
# 1. Definição dos Parâmetros da Geração com base na Tese
FPS = 32
FRAMES_PER_LATENT_CHUNK = 8
ECO_LATENT_CHUNKS = 2
total_frames_brutos = self._quantize_to_multiple(int(seconds_per_fragment * FPS), FRAMES_PER_LATENT_CHUNK)
total_latents_brutos = total_frames_brutos // FRAMES_PER_LATENT_CHUNK
frames_a_podar = 15 #self._quantize_to_multiple(int(total_frames_brutos * (trim_percent / 100)), FRAMES_PER_LATENT_CHUNK)
latents_a_podar = frames_a_podar // FRAMES_PER_LATENT_CHUNK
if total_latents_brutos <= latents_a_podar:
#raise gr.Error(f"A porcentagem de poda ({trim_percent}%) é muito alta. Reduza-a ou aumente a duração.")
raise ValueError(f"A porcentagem de poda ({trim_percent}%) é muito alta. Reduza-a ou aumente a duração.")
DEJAVU_FRAME_TARGET = 23
DESTINATION_FRAME_TARGET = total_frames_brutos -8
logger.info("--- CONFIGURAÇÃO DA GERAÇÃO ADUC-SDR ---")
logger.info(f"Total de Latents por Geração Exploratória (V_bruto): {total_latents_brutos} ({total_frames_brutos} frames)")
logger.info(f"Latents a serem descartados (Poda Causal): {latents_a_podar} ({frames_a_podar} frames)")
logger.info(f"Chunks Latentes do Eco Causal (C): {ECO_LATENT_CHUNKS}")
logger.info(f"Frame alvo do Déjà-Vu (D): {DEJAVU_FRAME_TARGET}")
logger.info(f"Frame alvo do Destino (K): {DESTINATION_FRAME_TARGET}")
logger.info("------------------------------------------")
# 2. Inicialização do Estado
base_ltx_params = {"guidance_scale": 1.0, "stg_scale": 0.005, "rescaling_scale": 0.05, "num_inference_steps": 4, "image_cond_noise_scale": 0.05}
keyframe_paths = [item[0] if isinstance(item, tuple) else item for item in keyframes]
video_clips_paths, story_history = [], ""
target_resolution_tuple = (video_resolution, video_resolution)
eco_latent_for_next_loop = None
dejavu_latent_for_next_loop = None
if len(keyframe_paths) < 1:
#raise gr.Error(f"A geração requer no mínimo 2 keyframes. Você forneceu {len(keyframe_paths)}.")
raise ValueError(f"A geração requer no mínimo 2 keyframes. Você forneceu {len(keyframe_paths)}.")
num_transitions_to_generate = len(keyframe_paths) -1
# 3. Loop Principal de Geração de Fragmentos
for i in range(num_transitions_to_generate):
fragment_index = i + 1
logger.info(f"--- INICIANDO FRAGMENTO {fragment_index}/{num_transitions_to_generate} ---")
# 3.1. Consulta ao Maestro (Γ) para obter a intenção (Pᵢ)
start_keyframe_path = keyframe_paths[i]
if i+1 < num_transitions_to_generate:
destination_keyframe_path = keyframe_paths[i + 1]
else:
destination_keyframe_path = keyframe_paths[i]
decision = Composer.execute_cognitive_task(
task_id="TASK_08_IMPROVISE_CINEMATIC_PROMPT_ATO",
template_data={"current_act_narrative": storyboard[i]},
images=[Image.open(start_keyframe_path), Image.open(destination_keyframe_path)]
)
motion_prompt = decision.strip()
story_history += f"\n- Ato {fragment_index}: {motion_prompt}"
# 3.2. Montagem das Âncoras para a Fórmula Canônica Ψ({C, D, K}, P)
conditioning_items = []
logger.info(" [Ψ.1] Montando âncoras causais...")
if eco_latent_for_next_loop is None:
logger.info(" - Primeiro fragmento: Usando Keyframe inicial como âncora de partida.")
img_start = Image.open(start_keyframe_path).convert("RGB")
img_dest = Image.open(destination_keyframe_path).convert("RGB")
start_latent, dest_latent = vae_manager_singleton.encode_batch([img_start, img_dest], target_resolution_tuple)
conditioning_items.append(LatentConditioningItem(start_latent, 0, 1.0))
else:
logger.info(" - Âncora 1: Eco Causal (C) - Herança do passado.")
conditioning_items.append(LatentConditioningItem(eco_latent_for_next_loop, 0, 1.0))
logger.info(" - Âncora 2: Déjà-Vu (D) - Memória de um futuro idealizado.")
conditioning_items.append(LatentConditioningItem(dejavu_latent_for_next_loop, 23, 0.5))
img_dest = Image.open(destination_keyframe_path).convert("RGB")
dest_latent = vae_manager_singleton.encode_batch([img_dest], target_resolution_tuple)[0]
logger.info(" - Âncora 3: Destino (K) - Âncora geométrica/narrativa.")
conditioning_items.append(LatentConditioningItem(dest_latent, DESTINATION_FRAME_TARGET, 1.0))
# 3.3. Execução da Câmera (Ψ): Geração Exploratória para criar V_bruto
logger.info(f" [Ψ.2] Câmera (Ψ) executando a geração exploratória de {total_latents_brutos} chunks latentes...")
current_ltx_params = {**base_ltx_params, "motion_prompt": motion_prompt}
latents_brutos, _ = ltx_manager_singleton.generate_latent_fragment(
height=video_resolution, width=video_resolution,
conditioning_items_data=conditioning_items,
video_total_frames=total_frames_brutos+1,
**current_ltx_params
)
# 3.4. Execução do Destilador (Δ): Implementação do Ciclo de Poda Causal
logger.info(f" [Δ] Shape do tensor bruto para vídeo final: {latents_brutos.shape}")
#latents_video = latents_brutos[:, :, :-1, :, :]
# --- Workaround empírico preservado ---
eco_latent_for_next_loop = latents_brutos[:, :, -5:-2, :, :].clone()
dejavu_latent_for_next_loop = latents_brutos[:, :, -1:, :, :].clone()
latents_video = latents_brutos[:, :, :-4, :, :].clone()
logger.info(f" [Δ] Shape do tensor video para vídeo final: {latents_video.shape}")
#if i+1 < num_transitions_to_generate:
#latents_video = latents_video[:, :, :-4, :, :]
# logger.info(f"@@@@@@@@@@# Nao é ULTIMO poda -1")
# logger.info(f" [Δ] -1 Shape do tensor video para vídeo final: {latents_video.shape}")
#if i > 0:
# latents_video = latents_video[:, :, 2:, :, :]
# logger.info(f"@@@@@@@@@@# nao é o primeiro poda 1")
# logger.info(f" [Δ] 1 Shape do tensor video para vídeo final: {latents_video.shape}")
logger.info(f" [Δ] Shape do tensor para vídeo final: {latents_video.shape}")
logger.info(f" - (Δ.1) Déjà-Vu (D) destilado. Shape: {dejavu_latent_for_next_loop.shape if dejavu_latent_for_next_loop is not None else 'N/A'}")
logger.info(f" - (Δ.2) Eco Causal (C) extraído. Shape: {eco_latent_for_next_loop.shape if eco_latent_for_next_loop is not None else 'N/A'}")
# 3.5. Renderização e Armazenamento do Fragmento Final
base_name = f"fragment_{fragment_index}_{int(time.time())}"
pixel_tensor = vae_manager_singleton.decode(latents_video)
video_path = os.path.join(self.workspace_dir, f"{base_name}.mp4")
video_encode_tool_singleton.save_video_from_tensor(pixel_tensor, video_path, fps=FPS)
video_clips_paths.append(video_path)
logger.info(f"--- FRAGMENTO {fragment_index} FINALIZADO E SALVO EM: {video_path} ---")
# 4. Montagem Final do Filme
final_movie_path = os.path.join(self.workspace_dir, f"final_movie_silent_{int(time.time())}.mp4")
final_movie_path = video_encode_tool_singleton.concatenate_videos(video_clips_paths, final_movie_path, self.workspace_dir)
#####(atenção Gemini .. nao apagar ou modificar nada acima dessa linha) #####
logger.info(f"Filme completo salvo em: {final_movie_path}")
# Retorna o resultado no formato esperado pelo Planner5D
return {
"final_path": final_movie_path,
"video_data": {"id": 0, "caminho_pixel": final_movie_path} # ID 0 para o filme completo
}
# --- Instância Singleton ---
deformes4d_engine_singleton = Deformes4DEngine() |