Stockmark Tech Blog

自然言語処理テクノロジーで社会を進化させる ストックマークのテックブログです。

2022-01-01から1年間の記事一覧

キーフレーズ抽出で振り返る2022年の業界別ニュース

ML

Anews について 業界別2022年のキーフレーズ キーフレーズの抽出 キーフレーズのスコアリング さいごに 参考文献 本記事は、Stockmark Advent Calendar 2022 の 12 日目の記事です。 年の瀬といえば流行語大賞ですね。今年 2022 年も 大谷ルール や オミクロ…

顧客体験の向上に向けた自然言語処理技術の活用: 定義文抽出

ML

はじめに 自然言語処理とは 構造化事例: 定義文抽出 定義文のニーズ 定義文抽出の流れ 抽出結果 今後の展望 記事の出典 はじめに こんにちは、Researcherの北山です。今回は自然言語処理技術を用いてAstrategyにおける顧客体験向上のための取り組みを行った…

CIは命綱 - 開発プロセスで意識・工夫していること

スキーマ駆動による開発効率化 Over Fetching を生み出さないAPI設計 価値のベースラインを保つリグレッションテスト 継続的なライブラリバージョンのメンテナンス CIは命綱 「推測するな、計測せよ」によるユーザー体験の向上 まとめ ストックマーク Co-VPo…

月間1.6億秒の Lambda x Node.js 利用から得られた知見

はじめに なぜ Node.js なのか? なぜ AWS Lambdaなのか? Lambda x Node.js でスクレイピングする際の落とし穴 落とし穴 その1: Puppeteer がクラッシュする 落とし穴 その2: Lambdaが最大並列実行数に到達しない 落とし穴 その3: 巨大なXMLの存在 落とし穴 …

プレスリリース駆動開発で起こった3つの変化

先に実物を紹介 プレスリリース駆動開発を起因とした3つの変化 1. 顧客のアトラクト強化 2. プロダクトオーナー自身の気づきによる新機能の洗練化 3. より効果的な画像が作成できるように まとめ ストックマークではプロダクト開発の方法として、プレスリリ…

開発チームのスケールに向けたブランチ戦略見直し

概要 背景:GitHubのブランチ戦略がチームスケールの弊害に 変更前の運用:コンフリクトと調整コストのトレードオフ 変更後の運用:ブランチ戦略見直しとFeature Flagの導入 今後に向けて 概要 組織の拡大に伴う開発チームの分割、独立性向上のためにGitHub…

個別最適でプロダクトを作り続けたスタートアップがデータ専任部隊を作ることにした話

ストックマークのプロダクトはデータに支えられている 「何もしてないのに壊れる」のではなく「何もしてないと壊れる」 Phase0: どちらのプロダクトが対応する? Phase1: 役割の一部を明確化 Phase2: データチームの切り出しへ Phase3: データプラットフォー…

日本語ニュース分類から見る多言語モデル

ML

ニュースタイトル分類タスクでの実験 英語での fine-tuning の効果 クラス別の精度評価 NAC での degradation おわりに 引用 Appendix: モデルの設定 グローバル化が進む現代において、様々な言語で情報収集を行う必要性がこれまで以上に高まっています。Sto…

検索エンジンのMore-Like-Thisクエリとグラフアルゴリズムによる類似記事集約

ML

はじめに 類似性グラフの構築 グラフの構成要素の抽出 バッチ計算 まとめ 本記事は Grouping Similar Articles with Search Engine More-Like-This Queries and Graph Algorithms の翻訳記事です。以前の記事である More Like This Query を活用した類似記事…

Grouping Similar Articles with Search Engine More-Like-This Queries and Graph Algorithms

ML

Introduction Building Similarity Graph Extracting Graph Components Batch computations Concluding Remarks Please refer here for a related post in Japanese. Introduction In Stockmark, we collect tens of thousands of news articles from thousa…

More Like This Query を活用した類似記事集約 入門

はじめに 類似記事集約がなぜ必要なのか? どうやって実装しているのか? More Like This Query のロジック 過去記事への再適用は大変… まとめと記事予告(ストックマーク独自の工夫) はじめに 本記事では、ストックマークのプロダクトの実装で工夫している類…

ボケて電笑戦への挑戦〜AIで画像大喜利〜

ML

ボケて電笑戦とは お笑いモデルの構築 教師データの準備 教師データの前処理 画像の前処理 テキストの前処理 お笑いモデルの構成と学習 お笑いモデルの構成 お笑いモデルの学習 生成したボケの後処理 生成したボケの評価 学習データにビジネスニュースを入れ…