rag-chain-agent/app/chain.py

from langchain.chains import RetrievalQA
from langchain_core.runnables import RunnablePassthrough
from langchain_core.output_parsers import StrOutputParser
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.runnables import RunnableLambda
from retriever import get_retriever
from llm import TritonLLM
import json

def build_chain():
    retriever = get_retriever()
    llm = TritonLLM()

    def build_chat_input(x):
        context = format_docs(retriever.invoke(x["question"]))
        messages = [
            {"role": "system", "content": f"다음 정보를 참고하여 사용자의 질문에 답변하세요:\n\n{x["context"]}\n\n답변할 수 없는 내용이면 솔직하게 모른다고 말하세요."},
            {"role": "user", "content": x["question"]}
        ]

        return  json.dumps(messages, ensure_ascii=False)

    # RAG 프롬프트 템플릿 생성
    prompt_template = ChatPromptTemplate.from_messages([
        ("system", """다음 정보를 참고하여 사용자의 질문에 답변하세요:

{context}

답변할 수 없는 내용이나 주어진 컨텍스트에 없는 내용이면 솔직하게 모른다고 말하세요.
답변은 주어진 컨텍스트에 기반하여 구체적이고 간결하게 작성하세요."""),
        ("human", "{question}")
    ])

    llm_with_params = RunnableLambda(
        lambda x: llm.invoke(x["question"], temperature=x.get("temperature"), max_tokens=x.get("max_tokens"))
    )

    def format_docs(docs):
        return "\n\n".join(f"문서: {i+1}\n{doc.page_content}" for i, doc in enumerate(docs))

    rag_chain = (
            {
                "context": RunnableLambda(lambda x: x["question"]) | retriever | format_docs,
                "question": lambda x: x["question"]
            }
            #| prompt_template
            | RunnableLambda(build_chat_input)
            | llm
            | StrOutputParser()
    )

    return rag_chain