hooman650
/

bge-large-en-v1.5-onnx-o4

Feature Extraction

text-embeddings-inference

Model card Files Files and versions

hooman650 commited on Nov 21, 2023

Commit

b385e6a

·

1 Parent(s): 69a20e6

Update README.md

Files changed (1) hide show

README.md +29 -0

README.md CHANGED Viewed

@@ -1,3 +1,32 @@
 ---
 license: mit
 ---

 ---
 license: mit
+language:
+- en
+library_name: transformers
+pipeline_tag: feature-extraction
 ---
+# BGE-Large-En-V1.5-ONNX-O4
+This is an `ONNX O4` strategy optimized version of [BAAI/bge-large-en-v1.5](https://huggingface.co/BAAI/bge-large-en-v1.5) optimal for `Cuda`. It should be much faster than the original
+version.
+https://media.githubusercontent.com/media/huggingface/text-embeddings-inference/main/assets/bs1-tp.png
+## Usage
+```
+# pip install "optimum[onnxruntime-gpu]" transformers
+from optimum.onnxruntime import ORTModelForFeatureExtraction
+from transformers import AutoTokenizer
+tokenizer = AutoTokenizer.from_pretrained('hooman650/bge-large-en-v1.5-onnx-o4')
+model = ORTModelForFeatureExtraction.from_pretrained('hooman650/bge-large-en-v1.5-onnx-o4')
+model.to("cuda")
+pairs = ["pandas usually live in the jungles"]
+with torch.no_grad():
+    inputs = tokenizer(pairs, padding=True, truncation=True, return_tensors='pt', max_length=512)
+    logits = model(**inputs, return_dict=True).logits
+```