ツール
システムツール
クリップボード、スクリーンショット、OCR、通知、ウィンドウ制御 —— ToShop を本格的なデスクトップ Agent にする組み込みツール。
ToShop には常に利用可能なシステムレベルのツールが一通り組み込まれており、Skill のインストールは不要です。Agent ループと組み合わせれば、日常のデスクトップ作業の大半をこなせます。
すべてのシステムツールは標準の権限フローに従います。読み取り専用(clipboard_read、list_windows、frontmost_app)は自動実行され、書き込み系(clipboard_write、screenshot、notify_user)は初回に確認します。
クリップボード
clipboard_read—— クリップボードの中身(テキストまたは画像)をタスクに読み込みます。clipboard_write—— Agent の出力でクリップボードを上書きします。
よくあるパターン:「クリップボードの中身を要約して、結果を書き戻して」。
画面キャプチャ & OCR
screenshot—— 全画面、ウィンドウ、または選択範囲をキャプチャします。macOS では画面収録の権限が必要です。OCR—— 任意の画像(スクリーンショット出力やローカルファイル)からテキストを抽出します。
よくあるパターン: PDF、スライド、誰かから送られてきたスクリーンショットからテキストを抜く。
通知
notify_user—— OS ネイティブの通知を送信します。長時間の Autopilot タスク終了時や、Agent があなたの注意を求めるときに使います。
ウィンドウ & アプリの状態
frontmost_app—— 現在最前面にあるアプリは何か。list_windows—— 開いているウィンドウを列挙し、Agent がどれを操作するか判断できるようにします。
よくあるパターン:「今見ているものを要約して」と言うと、Agent はまずウィンドウの状態を読んでから、どのツールを使うか決めます。
関連
- ファイルと Finder —— ローカルファイルを開く・表示する。
- ブラウザと Web —— URL を取得、ブラウザを操作。
- Skills —— これらのプリミティブの上に構築した、より大きな手順。
ToShopドキュメント