Spaces:

CoExperiences
/

aie4-final

Paused

App Files Files Community

angry-meow commited on Oct 18, 2024

Commit

8187b01

1 Parent(s): 31f9732

tidy up models file

Browse files

Files changed (1) hide show

models.py +33 -2

models.py CHANGED Viewed

@@ -20,7 +20,9 @@ os.environ["LANGCHAIN_ENDPOINT"] = constants.LANGCHAIN_ENDPOINT
 tracer = LangChainTracer()
 callback_manager = CallbackManager([tracer])
-qdrant_client = QdrantClient(url=constants.QDRANT_ENDPOINT, api_key=constants.QDRANT_API_KEY)
 opus3 = ChatAnthropic(
     api_key=constants.ANTRHOPIC_API_KEY,
@@ -67,12 +69,20 @@ gpt4o_mini = ChatOpenAI(
     callbacks=callback_manager
 )
 basic_embeddings = HuggingFaceEmbeddings(model_name="snowflake/snowflake-arctic-embed-l")
 tuned_embeddings = HuggingFaceEmbeddings(model_name="CoExperiences/snowflake-l-marketing-tuned")
 te3_small = OpenAIEmbeddings(api_key=constants.OPENAI_API_KEY, model="text-embedding-3-small")
 semanticChunker = SemanticChunker(
     te3_small,
     breakpoint_threshold_type="percentile"
@@ -91,14 +101,35 @@ RCTS = RecursiveCharacterTextSplitter(
     length_function=len,
 )
 semantic_tuned_Qdrant_vs = QdrantVectorStore(
     client=qdrant_client,
     collection_name="docs_from_ripped_urls_semantic_tuned",
     embedding=tuned_embeddings
 )
 semantic_tuned_retriever = semantic_tuned_Qdrant_vs.as_retriever(search_kwargs={"k" : 10})
-#compression
 compressor = CohereRerank(model="rerank-english-v3.0")
 compression_retriever = ContextualCompressionRetriever(
     base_compressor=compressor, base_retriever=semantic_tuned_retriever

 tracer = LangChainTracer()
 callback_manager = CallbackManager([tracer])
+########################
+### Chat Models      ###
+########################
 opus3 = ChatAnthropic(
     api_key=constants.ANTRHOPIC_API_KEY,
     callbacks=callback_manager
 )
+########################
+### Embedding Models ###
+########################
 basic_embeddings = HuggingFaceEmbeddings(model_name="snowflake/snowflake-arctic-embed-l")
 tuned_embeddings = HuggingFaceEmbeddings(model_name="CoExperiences/snowflake-l-marketing-tuned")
 te3_small = OpenAIEmbeddings(api_key=constants.OPENAI_API_KEY, model="text-embedding-3-small")
+#######################
+### Text Splitters  ###
+#######################
 semanticChunker = SemanticChunker(
     te3_small,
     breakpoint_threshold_type="percentile"
     length_function=len,
 )
+#######################
+###  Vector Stores  ###
+#######################
+qdrant_client = QdrantClient(url=constants.QDRANT_ENDPOINT, api_key=constants.QDRANT_API_KEY)
+semantic_Qdrant_vs = QdrantVectorStore(
+    client=qdrant_client,
+    collection_name="docs_from_ripped_urls",
+    embedding=te3_small
+)
+rcts_Qdrant_vs = QdrantVectorStore(
+    client=qdrant_client,
+    collection_name="docs_from_ripped_urls_recursive",
+    embedding=te3_small
+)
 semantic_tuned_Qdrant_vs = QdrantVectorStore(
     client=qdrant_client,
     collection_name="docs_from_ripped_urls_semantic_tuned",
     embedding=tuned_embeddings
 )
+#######################
+###  Retrievers     ###
+#######################
 semantic_tuned_retriever = semantic_tuned_Qdrant_vs.as_retriever(search_kwargs={"k" : 10})
 compressor = CohereRerank(model="rerank-english-v3.0")
 compression_retriever = ContextualCompressionRetriever(
     base_compressor=compressor, base_retriever=semantic_tuned_retriever