Stockmark Tech Blog

自然言語処理テクノロジーで社会を進化させる ストックマークのテックブログです。

Elasticsearch 7.10 → OpenSearch 2.17へダウンタイムゼロでアップグレードした話

こんにちは。ストックマークでエンジニアをしている飯森です。 弊社では検索エンジンとしてAmazon OpenSearch Service(以下、OpenSearchと表記)を利用しています。 今回、OpenSearchのエンジンバージョンをElasticsearch 7.10からOpenSearch 2.17にダウン…

Vue.jsのデバッグをちょっとスマートにする Chrome DevTools Custom formatters機能の紹介

ストックマーク株式会社でエンジニアをしている安藤です。 本記事は以前に開催していた社内勉強会にて使用していた教材 chibivue の著者であり、Vue.jsのコミッターでもある @ubugeeeiさん から教わったライブラリのデバッグをちょっとスマートに行うことが…

僕がClaude Codeに食われた日

こんにちは。 Anews の開発に携わっている Engineer の 羽柴 と申します。 先週 Claude Code を使い始めて衝撃を受け、勢いそのままに社内に布教活動をしました。 という内容をSNSにシェアしたら思ったより反響が テンション上がりすぎて社内向けに書いた pi…

これからLLM開発を始める方へ 〜軽量な特化モデル開発の課題とコスト〜

ストックマーク株式会社にて技術広報とウェブエンジニアを勤めている安藤です。 当社は生成AIをフルスクラッチで開発している企業ということもあり、LLMの開発についてのご質問をいただく機会が増えてきました。 そこで今回、LLMの新規開発・性能研究なども…

Devinがモバイルアプリに秩序をもたらしてくれた話

こんにちは。 Anews の開発に携わっている Engineer の 羽柴 と申します。 Anewsは企業向けに記事を個人や組織にレコメンド配信する機能を主としたアプリケーションで、モバイルアプリも提供しています。 しかし、このモバイルアプリは歴史的な経緯もあり「…

Stockmark-2-VL-100B:日本語に特化したドキュメント読解のためのChain-of-Thought視覚言語モデル

ストックマークは、GENIACの第2期にて開発した、ハルシネーションを大幅抑止した1,000億パラメータのドキュメント読解基盤モデル「Stockmark-2-VL-100B」をHuggingFace Hubで公開します。本モデルはQwen2.5-VL-72Bの合成データを用いているので、Qwenライセ…

「マルチモーダル・LLM・VLM・RAGの実践」機械学習エンジニアのためのLT & MeetUp イベントレポート

ストックマークで技術広報とエンジニアをしている安藤です。 今回、当社ストックマークとサイバーエージェント様、Algomatic様、Exa Enterprise AI様の各社と4社にて共同開催を行った 「マルチモーダル・LLM・VLM・RAGの実践」機械学習エンジニアのためのLT …

EMConf 2025 参加レポート

ストックマークの築谷(@tsukkee)です。 本記事では、2025/2/27(木)に開催されたEMConf 2025の参加レポートをお届けします。 EMConf 2025について オフィシャルサイトでは以下のように紹介されています。 Engineering Manager Conference Japan(EMConf JP)…

Stockmark 2: 日本語に特化した1000億パラメータLLMの開発と公開

ストックマークではGENIACの第2期のプロジェクトで日本語を主な対象とした1000億パラメータのLLMの開発を行なっています。このブログではGENIACの取り組みについて簡単に紹介します。また、開発自体はまだ続いていますが、一定の性能が出てきたことから、現…

図表を含む文書を解読するためのAI、レイアウト解析について

はじめに ストックマークResearcherの會田です。普段はマルチモーダルLLMや文書画像処理の研究開発に従事しています。 LLMの登場により、さまざまなデータソースを活用したチャットアプリケーションが急速に増えています。一方、企業の社内文書はWord, pptx,…