UE5-python/Content/Python/chatBot/BLOOM.py at master · Axlfc/UE5-python · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
from transformers import AutoModelForCausalLM, AutoTokenizer
import sys
import torch


models = ["bloom-560m", "bloom-1b1", "bloom-1b7", "bloom-3b", "bloom-7b1", "bloom"]
current_model_name = "bigscience/" + models[0]


def process_bot_answer(input_text, text_length=50):

    model = AutoModelForCausalLM.from_pretrained(current_model_name)
    tokenizer = AutoTokenizer.from_pretrained(current_model_name)

    # Tokenize the prompt and generate text using the BLOOM model
    inputs = tokenizer(input_text, return_tensors="pt")
    outputs = model.generate(inputs["input_ids"], max_length=text_length)

    # Decode the generated text and print it
    generated_text = tokenizer.decode(outputs[0])

    '''# Greedy Search
        #print(tokenizer.decode(model.generate(inputs["input_ids"], max_length=result_length, no_repeat_ngram_size=2)[0]))

        # Beam Search
        #print(tokenizer.decode(model.generate(inputs["input_ids"], max_length=result_length, num_beams=2, no_repeat_ngram_size=2, early_stopping=True)[0]))

        # Sampling Top-k + Top-p
        # print(tokenizer.decode(model.generate(inputs["input_ids"], max_length=result_length, do_sample=True, top_k=50, top_p=0.9)[0]))'''

    # Clean up resources
    del model
    del tokenizer
    torch.cuda.empty_cache()

    return generated_text


def main():
    if len(sys.argv) < 2:
        print("Please provide a text prompt as the first argument.")
        return

    if len(sys.argv) == 2:
        input_text = sys.argv[1]
        # Using default model as language_model
    elif len(sys.argv) == 3:
        input_text = sys.argv[1]
        text_length = int(sys.argv[2])

    # print(process_bot_answer(input_text, text_length))
    return(process_bot_answer(input_text, text_length))


if __name__ == '__main__':
    main()