npm SDK - The Token Company

View on GitHub

Installation

Install the SDK using npm:

npm install tokenc

Quick Start

Get started with just a few lines of code:

import { TokenClient } from "tokenc";

const client = new TokenClient({ apiKey: "your-api-key" });

const response = await client.compressInput({
    input: "Your text that needs compression for optimal token usage.",
    aggressiveness: 0.1
});

console.log(`Compressed text: ${response.output}`);
console.log(`Original tokens: ${response.originalInputTokens}`);
console.log(`Compressed tokens: ${response.outputTokens}`);
console.log(`Tokens saved: ${response.tokensSaved}`);
console.log(`Compression ratio: ${response.compressionRatio.toFixed(2)}x`);

API Reference

TokenClient

Constructor:

new TokenClient(options: TokenClientOptions)

apiKey

string

required

Your API key for authentication.

baseUrl

string

Base URL for the API.

timeout

number

default:"30000"

Request timeout in milliseconds.

compressInput()

Compress text input for optimized LLM inference.

input

string

required

The text to compress.

model

string

default:"bear-1.2"

Model to use. bear-1.2 (recommended), bear-1.1, or bear-1.

aggressiveness

number

default:"0.5"

Compression intensity 0.0-1.0.

maxOutputTokens

number | null

Maximum token count for output.

minOutputTokens

number | null

Minimum token count for output.

compressionSettings

CompressionSettings

Custom settings object (alternative to individual params).

Returns: Promise<CompressResponse>

CompressionSettings

Class for compression configuration.

aggressiveness

number

Compression intensity 0.0-1.0.

maxOutputTokens

number | null

Optional maximum output tokens.

minOutputTokens

number | null

Optional minimum output tokens.

CompressResponse

Class for compression results with built-in metrics.

// CompressResponse properties:
response.output                  // string: The compressed text
response.outputTokens            // number: Token count of compressed output
response.originalInputTokens     // number: Token count of original input
response.compressionTime         // number: Time taken to compress (seconds)

// Computed properties:
response.tokensSaved             // number: Number of tokens saved
response.compressionRatio        // number: Ratio of original to compressed tokens
response.compressionPercentage   // number: Percentage reduction in tokens

Examples

With OpenAI

Compress prompts before sending to OpenAI to reduce costs:

import { TokenClient } from "tokenc";
import OpenAI from "openai";

// Initialize clients
const tc = new TokenClient({ apiKey: "your-ttc-api-key" });
const openai = new OpenAI();

// Your prompt
const prompt = `Please explain the process of photosynthesis in detail,
including the light-dependent and light-independent reactions,
the role of chlorophyll, and how plants convert CO2 and water
into glucose and oxygen. Thank you very much for your help!`;

// Compress the prompt
const compressed = await tc.compressInput({
    input: prompt,
    aggressiveness: 0.6
});

console.log(`Compressed from ${compressed.originalInputTokens} to ${compressed.outputTokens} tokens`);
console.log(`Compression: ${compressed.compressionPercentage.toFixed(1)}%`);

// Use compressed prompt with OpenAI
const response = await openai.chat.completions.create({
    model: "gpt-4o",
    messages: [{ role: "user", content: compressed.output }]
});

console.log(response.choices[0].message.content);

Using CompressionSettings

Use a settings object for more control:

import { TokenClient, CompressionSettings } from "tokenc";

const client = new TokenClient({ apiKey: "your-api-key" });

// Create custom compression settings
const settings = new CompressionSettings({
    aggressiveness: 0.7,
    maxOutputTokens: 100,
    minOutputTokens: 50
});

const response = await client.compressInput({
    input: "Your text here...",
    compressionSettings: settings
});

console.log(`Compression percentage: ${response.compressionPercentage.toFixed(1)}%`);

Compression Levels

Compare different compression levels:

import { TokenClient } from "tokenc";

const client = new TokenClient({ apiKey: "your-api-key" });

const text = "Your long text here...";

// Light compression - preserve most content
const light = await client.compressInput({ input: text, aggressiveness: 0.2 });

// Moderate compression - balanced approach
const moderate = await client.compressInput({ input: text, aggressiveness: 0.5 });

// Aggressive compression - maximum savings
const aggressive = await client.compressInput({ input: text, aggressiveness: 0.8 });

Error Handling

The SDK provides specific error types for different error conditions:

import {
    TokenClient,
    AuthenticationError,
    InvalidRequestError,
    RateLimitError,
    APIError
} from "tokenc";

const client = new TokenClient({ apiKey: "your-api-key" });

try {
    const response = await client.compressInput({ input: "Your text..." });
} catch (error) {
    if (error instanceof AuthenticationError) {
        console.log("Invalid API key");
    } else if (error instanceof InvalidRequestError) {
        console.log(`Invalid request: ${error.message}`);
    } else if (error instanceof RateLimitError) {
        console.log("Rate limit exceeded, please wait");
    } else if (error instanceof APIError) {
        console.log(`API error: ${error.message}`);
    }
}

Exception	Description
`AuthenticationError`	Invalid API key
`InvalidRequestError`	Invalid request parameters
`PaymentRequiredError`	Insufficient balance
`RequestTooLargeError`	Request exceeds size limits
`RateLimitError`	Rate limit exceeded
`APIError`	Other API errors

Aggressiveness Guide

Recommended: Start with 0.1 for most use cases. Increase gradually if you need more savings.

Range	Level	Description
`0.1–0.3`	Light	Removes only obvious filler, safe for all use cases
`0.4–0.6`	Moderate	Good balance of compression and quality
`0.7–0.9`	Aggressive	Significant savings, best for cost-sensitive workloads

Docs

View on GitHub

​Installation

​Quick Start

​API Reference

​TokenClient

​compressInput()

​CompressionSettings

​CompressResponse

​Examples

​With OpenAI

​Using CompressionSettings

​Compression Levels

​Error Handling

​Aggressiveness Guide

Installation

Quick Start

API Reference

TokenClient

compressInput()

CompressionSettings

CompressResponse

Examples

With OpenAI

Using CompressionSettings

Compression Levels

Error Handling

Aggressiveness Guide