hive/core/framework/server/routes_sessions.py

"""Session lifecycle, info, and worker-session browsing routes.

Session-primary routes:
- POST   /api/sessions                               — create session (with or without worker)
- GET    /api/sessions                               — list all active sessions
- GET    /api/sessions/{session_id}                  — session detail
- DELETE /api/sessions/{session_id}                  — stop session entirely
- POST   /api/sessions/{session_id}/worker           — load a worker into session
- DELETE /api/sessions/{session_id}/worker           — unload worker from session
- GET    /api/sessions/{session_id}/stats            — runtime statistics
- GET    /api/sessions/{session_id}/entry-points     — list entry points
- PATCH  /api/sessions/{session_id}/triggers/{id}   — update trigger task
- GET    /api/sessions/{session_id}/graphs           — list graph IDs
- GET    /api/sessions/{session_id}/queen-messages   — queen conversation history
- GET    /api/sessions/{session_id}/events/history  — persisted eventbus log (for replay)

Worker session browsing (persisted execution runs on disk):
- GET    /api/sessions/{session_id}/worker-sessions                             — list
- GET    /api/sessions/{session_id}/worker-sessions/{ws_id}                     — detail
- DELETE /api/sessions/{session_id}/worker-sessions/{ws_id}                     — delete
- GET    /api/sessions/{session_id}/worker-sessions/{ws_id}/checkpoints         — list CPs
- POST   /api/sessions/{session_id}/worker-sessions/{ws_id}/checkpoints/{cp}/restore
- GET    /api/sessions/{session_id}/worker-sessions/{ws_id}/messages            — messages

"""

import json
import logging
import shutil
import time
from pathlib import Path

from aiohttp import web

from framework.server.app import (
    cold_sessions_dir,
    resolve_session,
    safe_path_segment,
    sessions_dir,
    validate_agent_path,
)
from framework.server.session_manager import SessionManager

logger = logging.getLogger(__name__)


def _get_manager(request: web.Request) -> SessionManager:
    return request.app["manager"]


def _session_to_live_dict(session) -> dict:
    """Serialize a live Session to the session-primary JSON shape."""
    info = session.worker_info
    phase_state = getattr(session, "phase_state", None)
    return {
        "session_id": session.id,
        "worker_id": session.worker_id,
        "worker_name": info.name if info else session.worker_id,
        "has_worker": session.worker_runtime is not None,
        "agent_path": str(session.worker_path) if session.worker_path else "",
        "description": info.description if info else "",
        "goal": info.goal_name if info else "",
        "node_count": info.node_count if info else 0,
        "loaded_at": session.loaded_at,
        "uptime_seconds": round(time.time() - session.loaded_at, 1),
        "intro_message": getattr(session.runner, "intro_message", "") or "",
        "queen_phase": phase_state.phase if phase_state else ("staging" if session.worker_runtime else "planning"),
    }


def _credential_error_response(exc: Exception, agent_path: str | None) -> web.Response | None:
    """If *exc* is a CredentialError, return a 424 with structured credential info.

    Returns None if *exc* is not a credential error (caller should handle it).
    Uses the CredentialValidationResult attached by validate_agent_credentials.
    """
    from framework.credentials.models import CredentialError

    if not isinstance(exc, CredentialError):
        return None

    from framework.server.routes_credentials import _status_to_dict

    # Prefer the structured validation result attached to the exception
    validation_result = getattr(exc, "validation_result", None)
    if validation_result is not None:
        required = [_status_to_dict(c) for c in validation_result.failed]
    else:
        # Fallback for exceptions without a validation result
        required = []

    return web.json_response(
        {
            "error": "credentials_required",
            "message": str(exc),
            "agent_path": agent_path or "",
            "required": required,
        },
        status=424,
    )


# ------------------------------------------------------------------
# Session lifecycle
# ------------------------------------------------------------------


async def handle_create_session(request: web.Request) -> web.Response:
    """POST /api/sessions — create a session.

    Body: {
        "agent_path": "..." (optional — if provided, creates session with worker),
        "agent_id": "..." (optional — worker ID override),
        "session_id": "..." (optional — custom session ID),
        "model": "..." (optional),
        "initial_prompt": "..." (optional — first user message for the queen),
    }

    When agent_path is provided, creates a session with a worker in one step
    (equivalent to the old POST /api/agents). Otherwise creates a queen-only
    session that can later have a worker loaded via POST /sessions/{id}/worker.
    """
    manager = _get_manager(request)
    body = await request.json() if request.can_read_body else {}
    agent_path = body.get("agent_path")
    agent_id = body.get("agent_id")
    session_id = body.get("session_id")
    model = body.get("model")
    initial_prompt = body.get("initial_prompt")
    # When set, the queen writes conversations to this existing session's directory
    # so the full history accumulates in one place across server restarts.
    queen_resume_from = body.get("queen_resume_from")

    if agent_path:
        try:
            agent_path = str(validate_agent_path(agent_path))
        except ValueError as e:
            return web.json_response({"error": str(e)}, status=400)

    try:
        if agent_path:
            # One-step: create session + load worker
            session = await manager.create_session_with_worker(
                agent_path,
                agent_id=agent_id,
                session_id=session_id,
                model=model,
                initial_prompt=initial_prompt,
                queen_resume_from=queen_resume_from,
            )
        else:
            # Queen-only session
            session = await manager.create_session(
                session_id=session_id,
                model=model,
                initial_prompt=initial_prompt,
                queen_resume_from=queen_resume_from,
            )
    except ValueError as e:
        msg = str(e)
        if "currently loading" in msg:
            resolved_id = agent_id or (Path(agent_path).name if agent_path else "")
            return web.json_response(
                {"error": msg, "worker_id": resolved_id, "loading": True},
                status=409,
            )
        return web.json_response({"error": msg}, status=409)
    except FileNotFoundError:
        return web.json_response(
            {"error": f"Agent not found: {agent_path or 'no path'}"},
            status=404,
        )
    except Exception as e:
        resp = _credential_error_response(e, agent_path)
        if resp is not None:
            return resp
        logger.exception("Error creating session: %s", e)
        return web.json_response({"error": "Internal server error"}, status=500)

    return web.json_response(_session_to_live_dict(session), status=201)


async def handle_list_live_sessions(request: web.Request) -> web.Response:
    """GET /api/sessions — list all active sessions."""
    manager = _get_manager(request)
    sessions = [_session_to_live_dict(s) for s in manager.list_sessions()]
    return web.json_response({"sessions": sessions})


async def handle_get_live_session(request: web.Request) -> web.Response:
    """GET /api/sessions/{session_id} — get session detail.

    Falls back to cold session metadata (HTTP 200 with ``cold: true``) when the
    session is not alive in memory but queen conversation files exist on disk.
    This lets the frontend detect a server restart and restore message history.
    """
    manager = _get_manager(request)
    session_id = request.match_info["session_id"]
    session = manager.get_session(session_id)

    if session is None:
        if manager.is_loading(session_id):
            return web.json_response(
                {"session_id": session_id, "loading": True},
                status=202,
            )
        # Check if conversation files survived on disk (post-restart scenario)
        cold_info = SessionManager.get_cold_session_info(session_id)
        if cold_info is not None:
            return web.json_response(cold_info)
        return web.json_response(
            {"error": f"Session '{session_id}' not found"},
            status=404,
        )

    data = _session_to_live_dict(session)

    if session.worker_runtime:
        rt = session.worker_runtime
        data["entry_points"] = [
            {
                "id": ep.id,
                "name": ep.name,
                "entry_node": ep.entry_node,
                "trigger_type": ep.trigger_type,
                "trigger_config": ep.trigger_config,
                **(
                    {"next_fire_in": nf}
                    if (nf := rt.get_timer_next_fire_in(ep.id)) is not None
                    else {}
                ),
            }
            for ep in rt.get_entry_points()
        ]
        # Append triggers from triggers.json (stored on session)
        runner = getattr(session, "runner", None)
        graph_entry = runner.graph.entry_node if runner else ""
        for t in getattr(session, "available_triggers", {}).values():
            entry = {
                "id": t.id,
                "name": t.description or t.id,
                "entry_node": graph_entry,
                "trigger_type": t.trigger_type,
                "trigger_config": t.trigger_config,
                "task": t.task,
            }
            mono = getattr(session, "trigger_next_fire", {}).get(t.id)
            if mono is not None:
                entry["next_fire_in"] = max(0.0, mono - time.monotonic())
            data["entry_points"].append(entry)
        data["graphs"] = session.worker_runtime.list_graphs()

    return web.json_response(data)


async def handle_stop_session(request: web.Request) -> web.Response:
    """DELETE /api/sessions/{session_id} — stop a session entirely."""
    manager = _get_manager(request)
    session_id = request.match_info["session_id"]

    stopped = await manager.stop_session(session_id)
    if not stopped:
        return web.json_response(
            {"error": f"Session '{session_id}' not found"},
            status=404,
        )

    return web.json_response({"session_id": session_id, "stopped": True})


# ------------------------------------------------------------------
# Worker lifecycle
# ------------------------------------------------------------------


async def handle_load_worker(request: web.Request) -> web.Response:
    """POST /api/sessions/{session_id}/worker — load a worker into a session.

    Body: {"agent_path": "...", "worker_id": "..." (optional), "model": "..." (optional)}
    """
    manager = _get_manager(request)
    session_id = request.match_info["session_id"]
    body = await request.json()

    agent_path = body.get("agent_path")
    if not agent_path:
        return web.json_response({"error": "agent_path is required"}, status=400)

    try:
        agent_path = str(validate_agent_path(agent_path))
    except ValueError as e:
        return web.json_response({"error": str(e)}, status=400)

    worker_id = body.get("worker_id")
    model = body.get("model")

    try:
        session = await manager.load_worker(
            session_id,
            agent_path,
            worker_id=worker_id,
            model=model,
        )
    except ValueError as e:
        return web.json_response({"error": str(e)}, status=409)
    except FileNotFoundError:
        return web.json_response({"error": f"Agent not found: {agent_path}"}, status=404)
    except Exception as e:
        resp = _credential_error_response(e, agent_path)
        if resp is not None:
            return resp
        logger.exception("Error loading worker: %s", e)
        return web.json_response({"error": "Internal server error"}, status=500)

    return web.json_response(_session_to_live_dict(session))


async def handle_unload_worker(request: web.Request) -> web.Response:
    """DELETE /api/sessions/{session_id}/worker — unload worker, keep queen alive."""
    manager = _get_manager(request)
    session_id = request.match_info["session_id"]

    removed = await manager.unload_worker(session_id)
    if not removed:
        session = manager.get_session(session_id)
        if session is None:
            return web.json_response(
                {"error": f"Session '{session_id}' not found"},
                status=404,
            )
        return web.json_response(
            {"error": "No worker loaded in this session"},
            status=409,
        )

    return web.json_response({"session_id": session_id, "worker_unloaded": True})


# ------------------------------------------------------------------
# Session info (worker details)
# ------------------------------------------------------------------


async def handle_session_stats(request: web.Request) -> web.Response:
    """GET /api/sessions/{session_id}/stats — runtime statistics."""
    manager = _get_manager(request)
    session_id = request.match_info["session_id"]
    session = manager.get_session(session_id)

    if session is None:
        return web.json_response(
            {"error": f"Session '{session_id}' not found"},
            status=404,
        )

    stats = session.worker_runtime.get_stats() if session.worker_runtime else {}
    return web.json_response(stats)


async def handle_session_entry_points(request: web.Request) -> web.Response:
    """GET /api/sessions/{session_id}/entry-points — list entry points."""
    manager = _get_manager(request)
    session_id = request.match_info["session_id"]
    session = manager.get_session(session_id)

    if session is None:
        return web.json_response(
            {"error": f"Session '{session_id}' not found"},
            status=404,
        )

    rt = session.worker_runtime
    eps = rt.get_entry_points() if rt else []
    entry_points = [
        {
            "id": ep.id,
            "name": ep.name,
            "entry_node": ep.entry_node,
            "trigger_type": ep.trigger_type,
            "trigger_config": ep.trigger_config,
            **(
                {"next_fire_in": nf}
                if rt and (nf := rt.get_timer_next_fire_in(ep.id)) is not None
                else {}
            ),
        }
        for ep in eps
    ]
    # Append triggers from triggers.json (stored on session)
    runner = getattr(session, "runner", None)
    graph_entry = runner.graph.entry_node if runner else ""
    for t in getattr(session, "available_triggers", {}).values():
        entry = {
            "id": t.id,
            "name": t.description or t.id,
            "entry_node": graph_entry,
            "trigger_type": t.trigger_type,
            "trigger_config": t.trigger_config,
            "task": t.task,
        }
        mono = getattr(session, "trigger_next_fire", {}).get(t.id)
        if mono is not None:
            entry["next_fire_in"] = max(0.0, mono - time.monotonic())
        entry_points.append(entry)
    return web.json_response({"entry_points": entry_points})


async def handle_update_trigger_task(request: web.Request) -> web.Response:
    """PATCH /api/sessions/{session_id}/triggers/{trigger_id} — update trigger task."""
    session, err = resolve_session(request)
    if err:
        return err

    trigger_id = request.match_info["trigger_id"]
    available = getattr(session, "available_triggers", {})
    tdef = available.get(trigger_id)
    if tdef is None:
        return web.json_response(
            {"error": f"Trigger '{trigger_id}' not found"},
            status=404,
        )

    try:
        body = await request.json()
    except Exception:
        return web.json_response({"error": "Invalid JSON body"}, status=400)

    task = body.get("task")
    if task is None:
        return web.json_response({"error": "Missing 'task' field"}, status=400)
    if not isinstance(task, str):
        return web.json_response({"error": "'task' must be a string"}, status=400)

    tdef.task = task

    # Persist to session state and agent definition
    from framework.tools.queen_lifecycle_tools import (
        _persist_active_triggers,
        _save_trigger_to_agent,
    )

    if trigger_id in getattr(session, "active_trigger_ids", set()):
        session_id = request.match_info["session_id"]
        await _persist_active_triggers(session, session_id)

    _save_trigger_to_agent(session, trigger_id, tdef)

    return web.json_response(
        {
            "trigger_id": trigger_id,
            "task": tdef.task,
        }
    )


async def handle_session_graphs(request: web.Request) -> web.Response:
    """GET /api/sessions/{session_id}/graphs — list loaded graphs."""
    manager = _get_manager(request)
    session_id = request.match_info["session_id"]
    session = manager.get_session(session_id)

    if session is None:
        return web.json_response(
            {"error": f"Session '{session_id}' not found"},
            status=404,
        )

    graphs = session.worker_runtime.list_graphs() if session.worker_runtime else []
    return web.json_response({"graphs": graphs})


# ------------------------------------------------------------------
# Worker session browsing (persisted execution runs on disk)
# ------------------------------------------------------------------


async def handle_list_worker_sessions(request: web.Request) -> web.Response:
    """List worker sessions on disk."""
    session, err = resolve_session(request)
    if err:
        # Fall back to cold session lookup from disk
        sid = request.match_info["session_id"]
        sess_dir = cold_sessions_dir(sid)
        if sess_dir is None:
            return err
    else:
        if not session.worker_path:
            return web.json_response({"sessions": []})
        sess_dir = sessions_dir(session)
    if not sess_dir.exists():
        return web.json_response({"sessions": []})

    sessions = []
    for d in sorted(sess_dir.iterdir(), reverse=True):
        if not d.is_dir():
            continue
        state_path = d / "state.json"
        if not d.name.startswith("session_") and not state_path.exists():
            continue

        entry: dict = {"session_id": d.name}

        if state_path.exists():
            try:
                state = json.loads(state_path.read_text(encoding="utf-8"))
                entry["status"] = state.get("status", "unknown")
                entry["started_at"] = state.get("started_at")
                entry["completed_at"] = state.get("completed_at")
                progress = state.get("progress", {})
                entry["steps"] = progress.get("steps_executed", 0)
                entry["paused_at"] = progress.get("paused_at")
            except (json.JSONDecodeError, OSError):
                entry["status"] = "error"

        cp_dir = d / "checkpoints"
        if cp_dir.exists():
            entry["checkpoint_count"] = sum(1 for f in cp_dir.iterdir() if f.suffix == ".json")
        else:
            entry["checkpoint_count"] = 0

        sessions.append(entry)

    return web.json_response({"sessions": sessions})


async def handle_get_worker_session(request: web.Request) -> web.Response:
    """Get worker session detail from disk."""
    session, err = resolve_session(request)
    if err:
        return err

    if not session.worker_path:
        return web.json_response({"error": "No worker loaded"}, status=503)

    # Support both URL param names: ws_id (new) or session_id (legacy)
    ws_id = request.match_info.get("ws_id") or request.match_info.get("session_id", "")
    ws_id = safe_path_segment(ws_id)

    state_path = sessions_dir(session) / ws_id / "state.json"
    if not state_path.exists():
        return web.json_response({"error": "Session not found"}, status=404)

    try:
        state = json.loads(state_path.read_text(encoding="utf-8"))
    except (json.JSONDecodeError, OSError) as e:
        return web.json_response({"error": f"Failed to read session: {e}"}, status=500)

    return web.json_response(state)


async def handle_list_checkpoints(request: web.Request) -> web.Response:
    """List checkpoints for a worker session."""
    session, err = resolve_session(request)
    if err:
        return err

    if not session.worker_path:
        return web.json_response({"error": "No worker loaded"}, status=503)

    ws_id = request.match_info.get("ws_id") or request.match_info.get("session_id", "")
    ws_id = safe_path_segment(ws_id)

    cp_dir = sessions_dir(session) / ws_id / "checkpoints"
    if not cp_dir.exists():
        return web.json_response({"checkpoints": []})

    checkpoints = []
    for f in sorted(cp_dir.iterdir(), reverse=True):
        if f.suffix != ".json":
            continue
        try:
            data = json.loads(f.read_text(encoding="utf-8"))
            checkpoints.append(
                {
                    "checkpoint_id": f.stem,
                    "current_node": data.get("current_node"),
                    "next_node": data.get("next_node"),
                    "is_clean": data.get("is_clean", False),
                    "timestamp": data.get("timestamp"),
                }
            )
        except (json.JSONDecodeError, OSError):
            checkpoints.append({"checkpoint_id": f.stem, "error": "unreadable"})

    return web.json_response({"checkpoints": checkpoints})


async def handle_delete_worker_session(request: web.Request) -> web.Response:
    """Delete a worker session from disk."""
    session, err = resolve_session(request)
    if err:
        return err

    if not session.worker_path:
        return web.json_response({"error": "No worker loaded"}, status=503)

    ws_id = request.match_info.get("ws_id") or request.match_info.get("session_id", "")
    ws_id = safe_path_segment(ws_id)

    session_path = sessions_dir(session) / ws_id
    if not session_path.exists():
        return web.json_response({"error": "Session not found"}, status=404)

    shutil.rmtree(session_path)
    return web.json_response({"deleted": ws_id})


async def handle_restore_checkpoint(request: web.Request) -> web.Response:
    """Restore from a checkpoint."""
    session, err = resolve_session(request)
    if err:
        return err

    if not session.worker_runtime:
        return web.json_response({"error": "No worker loaded in this session"}, status=503)

    ws_id = request.match_info.get("ws_id") or request.match_info.get("session_id", "")
    ws_id = safe_path_segment(ws_id)
    checkpoint_id = safe_path_segment(request.match_info["checkpoint_id"])

    cp_path = sessions_dir(session) / ws_id / "checkpoints" / f"{checkpoint_id}.json"
    if not cp_path.exists():
        return web.json_response({"error": "Checkpoint not found"}, status=404)

    entry_points = session.worker_runtime.get_entry_points()
    if not entry_points:
        return web.json_response({"error": "No entry points available"}, status=400)

    restore_session_state = {
        "resume_session_id": ws_id,
        "resume_from_checkpoint": checkpoint_id,
    }

    execution_id = await session.worker_runtime.trigger(
        entry_points[0].id,
        input_data={},
        session_state=restore_session_state,
    )

    return web.json_response(
        {
            "execution_id": execution_id,
            "restored_from": ws_id,
            "checkpoint_id": checkpoint_id,
        }
    )


async def handle_messages(request: web.Request) -> web.Response:
    """Get messages for a worker session."""
    session, err = resolve_session(request)
    if err:
        # Fall back to cold session lookup from disk
        sid = request.match_info["session_id"]
        sess_dir = cold_sessions_dir(sid)
        if sess_dir is None:
            return err
    else:
        if not session.worker_path:
            return web.json_response({"error": "No worker loaded"}, status=503)
        sess_dir = sessions_dir(session)

    ws_id = request.match_info.get("ws_id") or request.match_info.get("session_id", "")
    ws_id = safe_path_segment(ws_id)

    convs_dir = sess_dir / ws_id / "conversations"
    if not convs_dir.exists():
        return web.json_response({"messages": []})

    filter_node = request.query.get("node_id")
    all_messages = []

    def _collect_msg_parts(parts_dir: Path, node_id: str) -> None:
        if not parts_dir.exists():
            return
        for part_file in sorted(parts_dir.iterdir()):
            if part_file.suffix != ".json":
                continue
            try:
                part = json.loads(part_file.read_text(encoding="utf-8"))
                part["_node_id"] = node_id
                part.setdefault("created_at", part_file.stat().st_mtime)
                all_messages.append(part)
            except (json.JSONDecodeError, OSError):
                continue

    # Flat layout: conversations/parts/*.json
    if not filter_node:
        _collect_msg_parts(convs_dir / "parts", "worker")

    # Node-based layout: conversations/<node_id>/parts/*.json
    for node_dir in convs_dir.iterdir():
        if not node_dir.is_dir() or node_dir.name == "parts":
            continue
        if filter_node and node_dir.name != filter_node:
            continue
        _collect_msg_parts(node_dir / "parts", node_dir.name)

    # Merge run lifecycle markers from runs.jsonl (for historical dividers)
    runs_file = sess_dir / ws_id / "runs.jsonl"
    if runs_file.exists():
        try:
            for line in runs_file.read_text(encoding="utf-8").splitlines():
                line = line.strip()
                if not line:
                    continue
                try:
                    record = json.loads(line)
                    all_messages.append(
                        {
                            "seq": -1,
                            "role": "system",
                            "content": "",
                            "_node_id": "_run_marker",
                            "is_run_marker": True,
                            "run_id": record.get("run_id"),
                            "run_event": record.get("event"),
                            "created_at": record.get("created_at", 0),
                        }
                    )
                except json.JSONDecodeError:
                    continue
        except OSError:
            pass

    all_messages.sort(key=lambda m: m.get("created_at", m.get("seq", 0)))

    client_only = request.query.get("client_only", "").lower() in ("true", "1")
    if client_only:
        client_facing_nodes: set[str] = set()
        if session and session.runner and hasattr(session.runner, "graph"):
            for node in session.runner.graph.nodes:
                if node.client_facing:
                    client_facing_nodes.add(node.id)

        if client_facing_nodes:
            all_messages = [
                m
                for m in all_messages
                if m.get("is_run_marker")
                or (
                    not m.get("is_transition_marker")
                    and m["role"] != "tool"
                    and not (m["role"] == "assistant" and m.get("tool_calls"))
                    and (
                        (m["role"] == "user" and m.get("is_client_input"))
                        or (m["role"] == "assistant" and m.get("_node_id") in client_facing_nodes)
                    )
                )
            ]

    return web.json_response({"messages": all_messages})


async def handle_queen_messages(request: web.Request) -> web.Response:
    """GET /api/sessions/{session_id}/queen-messages — get queen conversation.

    Reads directly from disk so it works for both live sessions and cold
    (post-server-restart) sessions — no live session required.
    """
    session_id = request.match_info["session_id"]

    queen_dir = Path.home() / ".hive" / "queen" / "session" / session_id
    convs_dir = queen_dir / "conversations"
    if not convs_dir.exists():
        return web.json_response({"messages": [], "session_id": session_id})

    all_messages: list[dict] = []

    def _read_parts(parts_dir: Path, node_id: str) -> None:
        if not parts_dir.exists():
            return
        for part_file in sorted(parts_dir.iterdir()):
            if part_file.suffix != ".json":
                continue
            try:
                part = json.loads(part_file.read_text(encoding="utf-8"))
                part["_node_id"] = node_id
                # Use file mtime as created_at so frontend can order
                # queen and worker messages chronologically.
                part.setdefault("created_at", part_file.stat().st_mtime)
                all_messages.append(part)
            except (json.JSONDecodeError, OSError):
                continue

    # Flat layout: conversations/parts/*.json
    _read_parts(convs_dir / "parts", "queen")

    # Node-based layout: conversations/<node_id>/parts/*.json
    for node_dir in convs_dir.iterdir():
        if not node_dir.is_dir() or node_dir.name == "parts":
            continue
        _read_parts(node_dir / "parts", node_dir.name)

    all_messages.sort(key=lambda m: m.get("created_at", m.get("seq", 0)))

    # Filter to client-facing messages only
    all_messages = [
        m
        for m in all_messages
        if not m.get("is_transition_marker")
        and m["role"] != "tool"
        and not (m["role"] == "assistant" and m.get("tool_calls"))
    ]

    return web.json_response({"messages": all_messages, "session_id": session_id})


async def handle_session_events_history(request: web.Request) -> web.Response:
    """GET /api/sessions/{session_id}/events/history — persisted eventbus log.

    Reads ``events.jsonl`` from the session directory on disk so it works for
    both live sessions and cold (post-server-restart) sessions.  The frontend
    replays these events through ``sseEventToChatMessage`` to fully reconstruct
    the UI state on resume.
    """
    session_id = request.match_info["session_id"]

    queen_dir = Path.home() / ".hive" / "queen" / "session" / session_id
    events_path = queen_dir / "events.jsonl"
    if not events_path.exists():
        return web.json_response({"events": [], "session_id": session_id})

    events: list[dict] = []
    try:
        with open(events_path, encoding="utf-8") as f:
            for line in f:
                line = line.strip()
                if not line:
                    continue
                try:
                    events.append(json.loads(line))
                except json.JSONDecodeError:
                    continue
    except OSError:
        return web.json_response({"events": [], "session_id": session_id})

    return web.json_response({"events": events, "session_id": session_id})


async def handle_session_history(request: web.Request) -> web.Response:
    """GET /api/sessions/history — all queen sessions on disk (live + cold).

    Returns every session directory under ~/.hive/queen/session/, newest first.
    Live sessions have ``live: true, cold: false``; sessions that survived a
    server restart have ``live: false, cold: true``.
    """
    manager = _get_manager(request)
    live_sessions = {s.id: s for s in manager.list_sessions()}

    disk_sessions = SessionManager.list_cold_sessions()
    for s in disk_sessions:
        if s["session_id"] in live_sessions:
            live = live_sessions[s["session_id"]]
            s["cold"] = False
            s["live"] = True
            # Fill in agent_name from live memory if meta.json wasn't written yet
            if not s.get("agent_name") and live.worker_info:
                s["agent_name"] = live.worker_info.name
            if not s.get("agent_path") and live.worker_path:
                s["agent_path"] = str(live.worker_path)

    return web.json_response({"sessions": disk_sessions})


async def handle_delete_history_session(request: web.Request) -> web.Response:
    """DELETE /api/sessions/history/{session_id} — permanently remove a session.

    Stops the live session (if still running) and deletes the queen session
    directory from disk at ~/.hive/queen/session/{session_id}/.
    This is the frontend 'delete from history' action.
    """
    manager = _get_manager(request)
    session_id = request.match_info["session_id"]

    # Stop the live session if it exists (best-effort)
    if manager.get_session(session_id):
        await manager.stop_session(session_id)

    # Delete the queen session directory from disk
    queen_session_dir = Path.home() / ".hive" / "queen" / "session" / session_id
    if queen_session_dir.exists() and queen_session_dir.is_dir():
        try:
            shutil.rmtree(queen_session_dir)
        except OSError as e:
            logger.warning("Failed to delete session directory %s: %s", queen_session_dir, e)
            return web.json_response({"error": f"Failed to delete session: {e}"}, status=500)

    return web.json_response({"deleted": session_id})


# ------------------------------------------------------------------
# Agent discovery (not session-specific)
# ------------------------------------------------------------------


async def handle_discover(request: web.Request) -> web.Response:
    """GET /api/discover — discover agents from filesystem."""
    from framework.agents.discovery import discover_agents

    manager = _get_manager(request)
    loaded_paths = {str(s.worker_path) for s in manager.list_sessions() if s.worker_path}

    groups = discover_agents()
    result = {}
    for category, entries in groups.items():
        result[category] = [
            {
                "path": str(entry.path),
                "name": entry.name,
                "description": entry.description,
                "category": entry.category,
                "session_count": entry.session_count,
                "run_count": entry.run_count,
                "node_count": entry.node_count,
                "tool_count": entry.tool_count,
                "tags": entry.tags,
                "last_active": entry.last_active,
                "is_loaded": str(entry.path) in loaded_paths,
            }
            for entry in entries
        ]
    return web.json_response(result)


# ------------------------------------------------------------------
# Route registration
# ------------------------------------------------------------------


def register_routes(app: web.Application) -> None:
    """Register session routes."""
    # Discovery
    app.router.add_get("/api/discover", handle_discover)

    # Session lifecycle
    app.router.add_post("/api/sessions", handle_create_session)
    app.router.add_get("/api/sessions", handle_list_live_sessions)
    # history must be registered before {session_id} so it takes priority
    app.router.add_get("/api/sessions/history", handle_session_history)
    app.router.add_delete("/api/sessions/history/{session_id}", handle_delete_history_session)
    app.router.add_get("/api/sessions/{session_id}", handle_get_live_session)
    app.router.add_delete("/api/sessions/{session_id}", handle_stop_session)

    # Worker lifecycle
    app.router.add_post("/api/sessions/{session_id}/worker", handle_load_worker)
    app.router.add_delete("/api/sessions/{session_id}/worker", handle_unload_worker)

    # Session info
    app.router.add_get("/api/sessions/{session_id}/stats", handle_session_stats)
    app.router.add_get("/api/sessions/{session_id}/entry-points", handle_session_entry_points)
    app.router.add_patch(
        "/api/sessions/{session_id}/triggers/{trigger_id}", handle_update_trigger_task
    )
    app.router.add_get("/api/sessions/{session_id}/graphs", handle_session_graphs)
    app.router.add_get("/api/sessions/{session_id}/queen-messages", handle_queen_messages)
    app.router.add_get("/api/sessions/{session_id}/events/history", handle_session_events_history)

    # Worker session browsing (session-primary)
    app.router.add_get("/api/sessions/{session_id}/worker-sessions", handle_list_worker_sessions)
    app.router.add_get(
        "/api/sessions/{session_id}/worker-sessions/{ws_id}", handle_get_worker_session
    )
    app.router.add_delete(
        "/api/sessions/{session_id}/worker-sessions/{ws_id}", handle_delete_worker_session
    )
    app.router.add_get(
        "/api/sessions/{session_id}/worker-sessions/{ws_id}/checkpoints",
        handle_list_checkpoints,
    )
    app.router.add_post(
        "/api/sessions/{session_id}/worker-sessions/{ws_id}/checkpoints/{checkpoint_id}/restore",
        handle_restore_checkpoint,
    )
    app.router.add_get(
        "/api/sessions/{session_id}/worker-sessions/{ws_id}/messages",
        handle_messages,
    )